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PRÓLOGOS 


PRÓLOGO A LA PRIMERA EDICIÓN 


Desde hace más de dos milenios, una cierta familiaridad con la 
matemática ha sido considerada como parte indispensable de la for- 
mación intelectual de toda persona cultivada. En la actualidad, sin 
embargo, se halla en grave peligro el puesto ocupado tradicional- 
mente en la educación por esta disciplina; por desgracia, algunos de 
los profesionales que la representan comparten la responsabilidad de 
tal situación. La enseñanza de la matemática ha degenerado con fre- 
cuencia en un vacío entrenamiento de resolución de problemas, que 
si bien puede desarrollar una habilidad formal, no conduce en cam- 
bio a una comprensión. efectiva ni a una mayor independencia inte- 
lectual. La investigación matemática muestra una tendencia hacia la 
superespecialización y hacia una excesiva insistencia en lo abstracto; 
las aplicaciones y conexiones con otros campos del saber han sido 
descuidadas. Sin embargo, tal estado de cosas no debe. justificar una 
política de retraimiento. Por el contrario, la reacción opuesta puede 
y debe partir de aquellos que se sienten conscientes del valor de la 
disciplina intelectual. Profesores, estudiantes y público culto piden 
una reforma constructiva y no una resignación siguiendo la línea de 
menor resistencia. La meta será una verdadera comprensión de la 
matemática como un todo orgánico y como base para el prorat 
y la acción científicos. 

Algunos libros espléndidos de biografía e historia y otros más po- 
pulares han estimulado el interés general latente; pero el conocimiento 
no puede adquirirse utilizando únicamente medios indirectos. La 
comprensión de. la matemática no puede ser transmitida indirecta- 
mente o como un juego sin dificultades, como tampoco pueden adqui- 
rir una educación musical, a través de reseñas periodísticas brillan- 
tes, aquellos que no han escuchado buena música con frecuencia. Un 
contacto real con el contenido de la matemática viva es necesario, 
Sin embargo, cabe evitar algunos detalles de técnica y muchas digre- 
siones; la presentación de las matemáticas debe estar tan libre de 
excesos de rutina como del dogmatismo prohibitivo que rehuye 
revelar el motivo o la meta y. que constituye así un obstáculo. de 
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de mala fe para un esfuerzo honesto. Es posible seguir una ruta di- 
recta a partir de los elementos fundamentales hasta puntos avanza- 
dos, desde los cuales puedan divisarse la sustancia y las fuerzas di- 
rectrices de la matemática moderna. 


El presente libro es un.intento en esa dirección. Y en tanto que 
presupone únicamente los conocimientos que pueden adquirirse en la 
enseñanza media, puede considerarse como elemental. No constituye, 
sin embargo, una concésión a la tendencia peligrosa que consiste en 
soslayar toda dificultad. Su lectura requiere un cierto grado de ma- 
durez intelectual y un deseo de tener pensamientos propios. El libro 
está escrito para principiantes y entendidos, para estudiantes y pro- 
fesores, para filósofos e ingenieros, como libro de texto y de consulta. 
Quizá esto encierre una intención demasiado ambiciosa. Bajo la pre- 
sión de otros trabajos han sido hechas ciertas concesiones al publi- 
car el libro, después de varios años de preparación, antes de estar 
realmente terminado. Por ello, críticas y sugestiones serán bien 
recibidas. 


De todos modos, se espera que el libro pueda servir un propósito 
útil y constituir una contribución a la educación superior americana, 
procedente de alguien que está profundamente agradecido por la 
oportunidad que le fué ofrecida en este país. Mientras que la respon- 
sabilidad por el plan y la filosofía de esta publicación recae entera- 
mente en el que suscribe, todos los méritos que. pueda encerrar debe 
compartirlos con Herbert Robbins. Éste, desde el momento en que 
fué asociado a esta tarea, la ha considerado generosamente como su 
propia causa, y su colaboración ha desempeñado un papel. decisivo 
en el trabajo de completar la obra en su forma presente. 


Debo reconocimiento también a la ayuda de varios amigos. Dis- 
cusiones con Niels Bohr, Kurt Friedrichs y Otto Neugebauer han 
influído en la actitud filosófica e histórica; Edna Kramer nos ha 
hecho críticas constructivas desde el punto de vista de la enseñanza; 
David Gilbarg preparó las primeras notas de curso que originaron 
el libro; Ernest Courant, Norman Davids, Charles de Prima, Alfred 
Horn, Herbert Mintzer, Wolfgang Wasow y otros prestaron su ayuda 
en la interminable tarea de escribir varias veces el manuscrito, y-con- 
tribuyeron a muchas mejoras de detalle; Donald Flanders hizo varias 
sugestiones valiosas y arregló el manuscrito para la imprenta; John 
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Knudsen, Hertha von Gumppenberg, Irving Ritter y Otto Neuge- 
bauer prepararon las figuras; H. Whitney contribuyó a la colección 
de ejercicios del Apéndice. La General Education Board de la Fun- 
dación Rockefeller ha contribuido generosamente al desarrollo de los 
cursos y notas que fueron luego la base del libro. Gracias sean dadas 
también a la Waverly Press, y en particular a Grover C. Orth, por 
su trabajo, de una competencia extraordinaria; y a la Oxford Uni- 
versity Press, en especial a Philip Vaudrin y W. Oman, por su ani- 
mosa iniciativa y cooperación. 
R. COURANT. 


New RocHELLE, N. Y. 
Agosto de 1941. 


PRÓLOGO A LA SEGUNDA, TERCERA 
Y CUARTA EDICIONES 


Durante los últimos años, la fuerza de los acontecimientos condujo 
a una creciente demanda de información y enseñanza matemáticas. 
Ahora más que nunca existe el peligro de frustración y desilusión, a 
no ser que estudiantes y profesores interiten ver más allá del forma- 
lismo y manipulación matemáticos, y comprendan la verdadera. esen- 
cia de la matemática. Este libro fué escrito para esos profesores y 
estudiantes, y la acogida hecha a la primera edición confirma a los 
autores en la esperanza de que pueda ser de utilidad. 

Críticas de varios lectores han dado lugar a numerosas correccio- 
nes y mejoras. Graciás cordiales debemós a Natascha Artin por su 
generosa ayuda en la preparación de la cuarta edición. 


R. COURANT. 


New RocHELLE, N. Y. 
18 de marzo de 1943. 
10 de octubre de 1945, 
28 de octubre de 1947, 


CÓMO DEBE UTILIZARSE ESTE LIBRO 


El libro está escrito en un orden sistemático, pero esto no quiere 
decir que sea necesario que el lector lo estudie página a página y 
capítulo tras capitulo. Por ejemplo, la introducción histórica y filo- 
sófica puede muy bien dejarse para después de haber leido el resto. 
Los diferentes capítulos son, en gran parte, independientes unos de 
otros. Frecuentemente, el comienzo de una sección podrá ser com- 
prendido sin dificultad. Luego, el camino conducirá gradualmente ha- 
cia adelante, para llegar en el final de cada capítulo y en los suple- 
mentos a cuestiones más difíciles. Así, el lector que desee información 
general más bien que conocimientos específicos puede conformarse 
con una selección de materias que eluda los análisis detallados. 

El estudiante con poca base “matemática también puede hacer 
una selección. Asteriscos y tipos pequeños de letra indican partes que 
pueden ser omitidas en una primera lectura sin gran- perjuicio para 
la comprensión de las siguientes. Por otra parte, no habrá inconve- 
niente si el estudio se limita a las secciones o capítulos en los que el 
lector esté más interesado. La mayoría de los ejercicios son de ca- 
rácter no rutinario; los de mayor dificultad van marcados con un 
asterisco. El lector no debe alarmarse si no alcanza a resolver algu- 
nos de ellos. 

En los capitulos sobre construcciones geométricas y sobre máximos 
y..mínimos se encontrará material apropiado para grupos selectos sde 
estudiantes de cursos superiores. 

Esperamos que el libro servirá tanto para el estudiante que co- 
mienza como para el que esté más avanzado, así como para el profe- 
sional que se halle verdaderamente interesado en la matemática. Ade- 
más, puede servir como base para cursos de tipo no tradicional sobre 
los conceptos fundamentales de esta ciencia. Los capítulos III, IV 
y V pueden utilizarse en un curso de geometría, mientras los capítu- 
los VI y VIII ofrecen en conjunto una exposición autónoma del 
cálculo infinitesimal, en la que se concede atención especial a los con- 
ceptos básicos y se trata de evitar los métodos rutinarios. Pueden 
usarse como un texto inicial por un profesor que desee hacer contri- 
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buciones propias, completando el material de acuerdo con sus necesi- 
dades específicas y, especialmente, añadiendo otros ejemplos numéri- 
cos. Numerosos -ejercicios distribuidos a lo largo del texto y la co- 
lección adicional del final facilitarán el uso del libro en las clases. 

Esperamos también que el lector encuentre a menudo detalles de 
interés en muchas discusiones elementales que contienen el germen 
de más amplios desarrdllos. 
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INTRODUCCIÓN 


¿QUÉ ES LA MATEMÁTICA? 


La matemática, como una expresión de la mente humana, refleja 
la voluntad activa, la razón contemplativa y el deseo de perfección 
estética. Sus elementos básicos son: lógica e intuición, análisis y cons- 
trucción, generalidad y particularidad. Aunque diversas tradiciones 
han destacado aspectos diferentes, es únicamente el juego de estas 
fuerzas opuestas y la lucha por su síntesis lo que constituye la vida, 
la utilidad y el supremo valor de la ciencia matemática. 

Sin duda, todo el desarrollo matemático ha tenido sus raíces psi- 
cológicas en necesidades más o menos prácticas. Pero una vez en 
marcha, bajo la presión de las aplicaciones necesarias, dicho desarrollo 
gana impulso en sí mismo y trasciende los confines de una utilidad 
inmediata. Esta tendencia de la ciencia aplicada hacia la teórica apa- 
rece tanto en la historia antigua como en muchas de las contribucio- 
nes a la matemática moderna debidas a ingenieros y físicos. 

La historia de las matemáticas comienza en Oriente, donde, ha- 
cia el año 2000 a. de J.C., los babilonios poseían ya una gran canti- 
dad de material que podría ser clasificado hoy como perteneciente al 
álgebra elemental. Pero como ciencia, en el sentido moderno, la ma- 
temática aparece más tarde, en Grecia, entre los siglos v y rv antes 
de J.C. El contacto creciente entre el Oriente y los griegos, que co- 
mienza en los tiempos del imperio persa y culmina en el período 
que sigue a las expediciones de Alejandro, puso a los griegos al co- 
rriente de los conocimientos de los babilonios en matemática y astro- 
nomía. La matemática fué sometida entonces a las discusiones filo- 
sóficas que florecieron en las ciudades griegas. Los pensadores griegos 
se dieron pronto cuenta de las grandes dificultades inherentes a los 
conceptos matemáticos de continuidad, movimiento e infinitud, así 
como al problema de medir magnitudes arbitrarias con unidades pre- 
fijadas. Entonces fué llevado a cabo un admirable esfuerzo para ven- 
cerlas y el resultado, la teoría de Eudoxio del continuo geométrico, 
fué de tal perfección, que para encontrar algo que pueda comparár- 
sele es necesario qué, dos milenios más tarde, aparezca la teoría mo- 
derna de los números irracionales. La tendencia axiomático-deductiva 
en matemáticas tuvo su origen en tiempos de Eudoxio y cristalizó 
en los Elementos de Euclides. 
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Sin embargo, aunque la tendencia teórica y axiomática de la ma- 
temática griega es una de sus más importantes características y ha 
ejercido una influencia enorme, nunca se insistirá demasiado en que 
las aplicaciones y conexiones con la realidad física desempeñaron un 
papel importante como parte de la matemática de la antigüedad, y 
que en muchas ocasiones fué preferido un modo de exposición menos 
rígido que el de Euclides. 

Es muy posible que el descubrimiento de las dificultades relacio- 
nadas con las cantidades inconmensurables desviara a los griegos del 
desarrollo del cálculo numérico, alcanzado con anterioridad en Oriente. 
En su lugar, se abrieron camino a través de la geometría axiomática 
pura. Y así comenzó un extraño rodeo en la historia de la ciencia, 
y quizá se perdió una gran oportunidad. Durante casi dos mil años 
el peso de la tradición geométrica griega retrasó la inevitable evolu- 
ción del concepto de número y el desarrollo del cálculo algebraico, 
que más tarde habían de ser la base de la ciencia moderna. 

Después de un período de preparación lenta, la revolución en la 
matemática y en la ciencia comenzó su fase vigorosa en el siglo xvir, 
con la geometría analítica y el cálculo diferencial e integral. Mientras 
la geometría griega conserva aún un lugar destacado, el ideal griego 
de cristalización axiomática y de deducción sistemática desaparece 
durante los siglos xvi y xvu. Razonamientos lógicos rigurosos, a 
partir de definiciones claras y no contradictorias, axiomas evidentes, 
fueron cuestiones sin importancia para los nuevos exploradores de la 
ciencia matemática. En una verdadera orgía de conjeturas intuitivas, 
de razonamientos convincentes entrelazados con un misticismo sin 
sentido, con una confianza ciega en el poder sobrehumano de los 
procesos formales, conquistaron un mundo matemático de inmensas 
riquezas. Luego, gradualmente, la exaltación del progreso dejó el paso 
a un espíritu de autocrítica. En el siglo x1x la necesidad inmanente 
de consolidar, y el deseo de una mayor seguridad en la extensión de 
la enseñanza superior, que había impulsado Ja Revolución francesa, 
condujo inevitablemente a una revisión de los fundamentos de la 
nueva matemática, en particular del cálculo diferencial e integral, 
así como del concepto fundamental de límite. Así, el siglo xix cons- 
tituyó no sólo un período de nuevos avances, sino que además puede 
caracterizarse por un afortunado retorno al ideal clásico de preci- 
sión y demostraciones rigurosas. Y en este sentido llegó a superar al 
modelo de la ciencia griega. Una vez más'el péndulo se inclinó del 
lado de la pureza lógica y de la abstracción. Actualmente vivimos 
aún en este período, aunque es de esperar que la desafortunada se- 
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paración entre la matemática pura y las aplicaciones a la vida, quizá 
inevitable en tiempos de revisión crítica, venga seguida de una era 
de íntima unidad. 

La renovada solidez interna, y sobre todo la simplificación enorme 
alcanzada sobre la base de una comprensión más clara, hacen posible 
hoy poder dominar la teoría matemática sin perder de vista las apli- 
caciones. Establecer de nuevo una unión orgánica entre ciencia pura 
y aplicada y un equilibrio estable entre la generalidad abstracta y la 
individualidad concreta puede ser muy bien la tarea universal de 
la matemática en el futuro inmediato. 

No es éste el lugar para un análisis filosófico o psicológico deta- 
llado de la matemática. Únicamente podemos destacar algunos pun- 
tos. Parece existir un grave peligro en el excesivo predominio del 
carácter axiomático-deductivo de las matemáticas, Ciertamente, el 
elemento de invención constructiva, de intuición directora, escapa a 
una simple formulación filosófica; sin embargo, continúa siendo el: 
núcleo de todo resultado matemático, aun en los campos más abstrac- 
tos. Si la forma deductiva cristalizada es la meta, la intuición y la 
construcción son, cuando menos, las fuerzas directrices. Una ame- 
naza seria para la verdadera vida de la ciencia aparece contenida en 
la afirmación de que la matemática no es más que un sistema de con- 
clusiones derivadas de definiciones y postulados que deben ser com- 
patibles, pero que, por lo demás, pueden ser creación de la libre vo- 
luntad del matemático. Si esta descripción fuera exacta, las matemá- 
ticas no podrían interesar a ninguna “persona inteligente. Sería un 
juego con definiciones, reglas y silogismos, sin meta ni motivo alguno. 
La noción de que el intelecto puede crear sistemas de postulados 
plenos de significado de modo arbitrario es una verdad «a medias» 
decepcionante. Únicamente bajo una disciplina de responsabilidad 
frente a un todo orgánico, guiada sólo por necesidades intrínsecas, 
puede la mente libre obtener resultados de valor científico. 

Aunque la tendencia pasiva del análisis lógico no puede repre- 
sentar toda la matemática, ha conducido, sin embargo, a una com- 
prensión más profunda de los hechos matemáticos y de su interde- 
pendencia, y también a una mayor penetración en la esencia de los 
conceptos matemáticos. A partir de ella se ha desarrollado un punto 
de vista moderno en las matemáticas que es característico de una 
actitud científica universal. 

Cualquiera que sea el punto de vista filosófico, para todos los 
propósitos de observación científica, un objeto agota en sí la totalidad 
de relaciones posibles respecto del observador o del instrumento. Na- 
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turalmente, la simple percepción no constituye conocimiento; debe 
ser coordinada e interpretada con referencia a alguna entidad subya- 
cente, una «cosa en sí», que no es un objeto de la observación física 
directa, sino que pertenece a la metafísica. Sin embargo, en el pro- 
eeso científico es importante descartar los elementos de carácter me- 
tafísico y considerar los hechos observables como la última fuente de 
nociones y construcciones. Renunciar a la meta de comprender la 
«cosa en sí», de conocer la «realidad última», de desentrañar la esen- 
cia más íntima del mundo, puede ser psicológicamente penoso para 
entusiastas ingenuos, pero de hecho es uno de los sacrificios de con- 
secuencias más fecundas en el pensamiento moderno. 

Algunos de los mayores avances en la física han sido el premio 
a una adhesión decidida al principio de eliminar la metafísica. Cuando 
Einstein consiguió reducir la noción de «sucesos simultáneos que ocu- 
rren en lugares distintos» a fenómenos observables; cuando señaló 
como. prejuicio metafísico la creencia de que este concepto debe tener 
un significado científico en sí mismo, encontró la clave de su teoría 
de la relatividad. Cuando Niels Bohr y sus discípulos analizaron el 
hecho de que toda observación física va acompañada de un efecto 
del instrumento observador en el objeto observado, se hizo claro que 
el intento de fijar simultáneamente la posición y la velocidad de una 
partícula no es posible en el sentido de la física. Las consecuencias 
trascendentes de este descubrimiento, contenidas en la teoría moderna 
de la mecánica cuántica, son hoy familiares a todo físico. En el siglo 
pasado prevaleció la idea de que las fuerzas mecánicas y los movi- 
mientos de partículas en el espacio eran cosas en sí mismas, mien- 
tras que electricidad, luz y magnetismo debían ser reducidos o expli- 
cados como fenómenos mecánicos, de la misma manera que se hacía 
con el calor. El éter fué inventado como medio hipotético capaz de 
los movimientos mecánicos no explicados satisfactoriamente y que 
aparecían bajo las formas de luz y electricidad. Poco a poco se com- 
prendió que el éter era necesariamente inobservable; por consiguiente, 
no pertenecía a'la física, sino a la metafísica. Con pena por algunos 
y con satisfacción por otros, las explicaciones mecánicas de la luz y la 
electricidad, y con ellas el éter, debieron ser finalmente abandonadas. 

Una situación análoga, quizá más acentuada, existe en la mate- 
mática. A través de los tiempos, los matemáticos consideraron sus 
objetos, tales como números, puntos, etc., como cosas sustanciales 
en sí. Pero en vista de que estos entes desafiaban siempre los intentos 
para una descripción adecuada, los matemáticos del siglo pasado lle- 
garon paulatinamente a la convicción de que el problema de la signifi- 
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cación de dichos objetos como cosas sustanciales no tenía, en modo 
alguno, sentido dentro de las matemáticas. Las únicas proposiciones 
relativas a ellos que pueden importar no se refieren a su realidad 
sustancial; representan únicamente las relaciones mutuas entre «obje- 
tos indefinidos» y las reglas que rigen las operaciones con ellos. Lo 
que «realmente» son los puntos, las rectas y los números ni se puede 
ni es necesario discutirlo en la ciencia matemática. Lo que interesa 
y lo que corresponde a hechos comprobables es su estructura y relación: 
que dos puntos determinan una recta, que los números se combinan 
según ciertas reglas para formar otros números, etc. La percepción 
clara de la necesidad de una desustanciación de los conceptos elemen- 
tales matemáticos ha sido uno de los resultados más importantes y 
fecundos del desarrollo axiomático moderno. 

Por suerte, las mentes creadoras olvidan las creencias filosóficas 
dogmáticas cuando la persistencia en ellas podría impedir resultados 
constructivos. Tanto para entendidos como para profanos no es la 
filosofia, y sí únicamente la experiencia activa en matemáticas, la 
que puede responder a la pregunta: ¿Qué es la matemática? 


CAPÍTULO PRIMERO 
LOS NÚMEROS NATURALES 


Introducción. —Los números son la base de la matemática mo- 
derna. Ahora bien: ¿qué es un número? ¿Qué significado tiene decir 
ifa Ft = 1, the th = tHe y (— 1) (— 1) = 1? En la segunda ense- 
ñanza se aprende el manejo de las fracciones y de los números nega- 
tivos, pero una comprensión efectiva de los sistemas de números 
requiere investigar sus elementos más simples. Mientras los griegos 
hacen de los conceptos geométricos de punto y recta la base de sus 
matemáticas, hoy se admite como principio director que todas las 
proposiciones matemáticas pueden ser reducidas en última instancia 
a proposiciones sobre los números naturales: 1, 2, 3,... «Dios creó los 
números naturales; el resto es obra de los hombres.» Con estas pala- 
bras Leópold Kronecker (1823-1891) señaló la base precisa sobre la 
cual puede construirse el edificio de la matemática. 

Creados por la mente humana para contar objetos agrupados de 
diversos modos, los números no contienen referencia alguna a las ca- 
racterísticas de los objetos contados. El número 6 es una abstracción 
obtenida a partir de todas las colecciones que contienen seis cosas; no 
depende de las cualidades específicas de dichas cosas ni de los símbolos 
usados para representarlas. Únicamente en etapas avanzadas del 
desarrollo intelectual llega a percibirse con toda claridad el carác- 
ter abstracto de la idea de número. Para los niños, los números están 
siempre ligados a objetos tangibles, tales camo dedos o bolas, y los 
lenguajes primitivos dan a los números un sentido concreto, desig- 
nando con palabras distintas los números que corresponden a dife- 
rentes tipos de objetos. 

Por suerte, los matemáticos no tienen que ocuparse del aspecto 
filosófico de la transición que da el paso de colecciones de objetos 
concretos al concepto abstracto de número. 

Consideraremos, por tanto, como dados los números naturales, jun- 
to con las dos operaciones fundamentales, adición y multiplicación, 
mediante las cuales pueden ser combinados. 


I. CÁLCULO CON NÚMEROS ENTEROS 


1. Leyes de la aritmética.—La teoría matemática de los números 
naturales o enteros positivos se conoce con el nombre de aritmética. 
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Se basa en el hecho de que la adición y multiplicación de enteros 
están regidas por ciertas leyes. Para enunciar estas leyes con toda 
generalidad no podemos limitarnos a usar símbolos tales como 1, 2, 3, 
que se refieren a enteros particulares. La proposición 


142=2+1 


es únicamente un caso particular de la ley general que dice que la 
suma de dos enteros no depende del orden en que éstos se consideren. 
- En consecuencia, si queremos expresar el hecho de que una cierta 

relación entre enteros es válida, cualesquiera que sean los valores de 
los enteros considerados, debemos representarlos simbólicamente me- 
diante letras: a, b, c,... De acuerdo con esto podemos enunciar las 
conocidas cinco leyes fundamentales de la aritmética: 

1) a+b=b+a. 3) a+(b+c=(a+b)+<c. 

2) ab = ha. 4) a(bc) = (ab)c. 

5) alb + c) = ab + ac. 

Las dos primeras son las leyes conmutativas de la adición y de la 
multiplicación; indican que el orden de los elementos que intervienen 
en dichas operaciones puede ser alterado. La tercera, que es la ley 
asociativa de la adición, dice que, en la adición de tres números, se 
obtiene el mismo resultado si se añade al primero la suma del segundo 
y el tercero, o al tercero la suma del primero y el segundo. La cuarta 
es la ley asociativa de la multiplicación. La última, que és la ley dis- 
tributiva, expresa que para multiplicar una suma por un entero se 
puede multiplicar cada término de la suma por dicho entero y sumar 
luego los productos obtenidos. 

Estas leyes de la aritmética son muy simples e incluso parecen 
evidentes. Sin embargo, pueden no ser aplicables a otros entes dis- 
tintos de los números enteros. Así, si a y bson símbolos no de enteros, 
sino de sustancias químicas, y si adición se entiende en su sentido 
corriente, es evidente que la ley conmutativa no es siempre válida; 
p. ej., si se añade ácido sulfúrico a agua se obtiene una solución diluí- 
da, mientras que la adición de agua a ácido sulfúrico puro puede 
acarrear consecuencias catastróficas para el experimentador. Análogas 
consideraciones probarían que, en este tipo de «aritmética» química, 
las leyes asociativa y distributiva de la adición pueden muy bien no ser 
ciertas. Asimismo es probable imaginar tipos de aritméticas en las 
cuales alguna o varias de las leyes 1) a 5) no sean válidas. De hecho, 
tales sistemas son estudiados efectivamente en la matemática moderna. 

Un modelo concreto para el concepto abstracto de entero indicará 
bien las bases intuitivas sobre las que reposan las leyes 1) a 5). En 
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vez de usar los símbolos habituales 1, 2, 3,..., representemos los ente- 
ros que dan el número de objetos de una colección determinada (p. ej., 
colección de manzanas de un árbol particular) mediante puntos si- 
tuados en casillas rectangulares, de modo que a cada objeto corres- 
ponda un punto. Operando con estos rectángulos se pueden estudiar 
las leyes de la aritmética de los enteros. Para sumar dos enteros a y b, 
dispóngamos los rectángulos correspondientes uno contiguo al otro, 
siprimiendo la raya de separación. 


2] MEE e 
FiG. 1.—Adición. 


Para multiplicar a por b, coloquemos los puntos de los dos rec- 
tángulos en filas y formemos un nuevo rectángulo con a filas y b 
columnas de puntos. Las reglas 1)-5) 


Fic. 2.-—Multiplicación, 


corresponderán entonces de modo intuitivo a propiedades evidentes 
de las operaciones indicadas con los rectángulos. 


mo (oro) FA FEF 


Fic. 3.—La ley distributiva. 


A partir de la definición de adición de dos enteros se puede defi- 
nir la relación de desigualdad. Las dos proposiciones equivalentes, 
a < b (léase «a menor que b») y b > a (léase «b mayor que a»), signi- 
fican que el rectángulo b puede obtenerse a partir del a mediante 
la adición de un tercer rectángulo conveniente, c, de modo que se 
tenga b = a + c. Si escribimos esto en la forma 


c = b —a, 
definimos la operación llamada sustracción. 
E E 


Fic. 4,—Sustracción, 
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La adición y la sustracción se llaman operaciones inversas, ya que 
si la adición del entero d al entero a es seguida de la sustracción del 
entero d de la suma obtenida, el resultado es el entero inicial a: 


(a + d)-d=a. 


Debe observarse que el entero b — a ha sido definido únicamente en 
el caso en que se tenga b > a. La interpretación del símbolo b — a 
como entero negativo cuando sea b < a será discutida más adelante 
(páginas 63 y siguientes). 

A menudo es conveniente usar una de las notaciones equivalentes, 
b = a (léase «b mayor o igual que a») o a £ b (léase «a menor o igual 
que b»), para indicar la proposición contraria de la a > b; p. ej., escri- 
biremos: 2 > 2, y 3 > 2, ñ 

Haremos ahora una pequeña ampliación del dominio de los ente- 
ros positivos, representados por rectángulos con puntos, introducien- 
do el entero cero, que representaremos por un rectángulo vacio. De- 
notando éste con el habitual símbolo 0, se tiene, de acuerdo con nues- 
tra definición de adición y multiplicación: ; 


a+0=a, 
«:0=0, 


cualquiera que sea el entero a. En efecto, a + 0 indica la adición de 
un rectángulo vacío al rectángulo a, mientras que a» 0 indica un 
rectángulo sin columnas; es decir, vacío. Parece entonces natural ex- 
tender también la definición de sustracción, poniendo 


a-a=0 


para todo entero a. Se tienen así las propiedades aritméticas caracte- 
rísticas del cero. 

Modelos geométricos análogos a los rectángulos de puntos, tales 
como los antiguos ábacos, fueron usados frecuentemente hasta fines 
de la Edad Media; pero quedaron desplazados poco a poco por otros 
métodos simbólicos más cómodos, basados en el sistema decimal. 

2. Representación de los números enteros.—Ha de distinguirse 
netamente entre un número entero y los símbolos 5, V, .... usados 
para representarlo. En el sistema decimal los diez símbolos: 0, 1, 2, 
3, ..., 9, se utilizan para representar el cero y los nueve primeros 
enteros positivos. Un entero mayor, p. ej., el «trescientos setenta y 
dos», puede expresarse en la forma 


300 + 70+2=3-101+7-1042, 
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y se representa en el sistema decimal por el símbolo 372. Es de funda- 
mental importancia observar que aquí la significación de los símbolos 
3, 7, 2 es relativa y depende de su posición en el lugar de las unidades, 
decenas o centenas. Con esta «notación relativa» se puede representar 
cualquier entero utilizando únicamente los símbolos de los diez pri- 
meros números en varias combinaciones. La regla general consiste en 
expresar todo entero en la forma ilustrada por el ejemplo 


z=a: 100 + b- 102 4+c- 10 + d, 


donde los números a, b, c, d son enteros de cero a nueve. El entero z 
se representa entonces en la forma abreviada 


abed. 


Notemos de paso que los coeficientes d, c, b, a son los restos obtenidos 
mediante divisiones sucesivas de z por 10; asi 


372 | 10 
2137] 10 


713 410 
3 f0 


La expresión particular dada antes para z puede servir única- 
mente para números menores que 10000, ya que para enteros ma- 
yores serán necesarias más de cuatro cifras. Si z es un entero com- 
prendido entre 10 000 y 100 000, lo podremos escribir en la forma 


z=a: 1045-1081 c-108+d:10+e€e, 


y representarlo por el símbolo abcde. Análogas consideraciones valen 
para enteros comprendidos entre 100 000 y 1 000 000, etc. Será con- 
veniente disponer de un medio de indicar el resultado con toda gene- 
ralidad mediante una sola fórmula. Para ello designemos los distintos 
coeficientes: e, d, c,..., con una sola letra afectada de subíndices: de, a, 
Ar Qs, ..., € indiquemos el hecho de que las potencias de 10 pueden 
ser tan grandes como sea necesario designando la mayor potencia que 
interviene, no con 10% ó 10%, como en los ejemplos anteriores, sino 
con 102, donde n ha de interpretarse como un entero arbitrario. En- 
tonces el método general para representar un entero z en el sistema 
decimal consistirá en expresar z en la forma 


Z = da * 102 + an, ° 1021 +... + a, : 10 + ap 11] 
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y representarlo por el símbolo 
AnUn—1Mn-2 < LR 


Como en los casos anteriores, los números do, ay, as ..., An, compren- 
didos entre 0 y 9, serán precisamente los restos sucesivos de dividir z 
repetidamente por 10. 

En el sistema decimal el número 10 ha sido tomado especialmente 
para servir de base. A primera vista quizá no resalte el hecho de que 
la elección del 10 no es esencial, y que cualquier entero mayor que 
uno habria podido servir para el mismo objeto; p. ej., podría usarse 
un sistema septimal (de base 7). En dicho sistema, un entero se expre- 
saría en la forma 


NM 12] 


donde las b serían enteros, elegidos entre 0, 1,... y 6, y se represen- 
taría por el símbolo - 


Bndn=, «byb - 


Así, «ciento nueve» se representaría en el sistema septimal por el sim- 
bolo 214, que significaría 


2-74 1744, 


Como ejercicio, el lector puede probar la regla general que permite 
pasar de la base diez a otra base cualquiera B, y que consiste en 
efectuar divisiones sucesivas del número z por B; los restos sucesivos 
serán las cifras del número en el sistema de base B; p. ej.: 


1917 
4115|7 
11217 
210 
109 (en el sistema decimal) = 214 (en el sistema septimal). 


Es natural preguntarse: ¿cuál será la base más conveniente? Puede 
verse que bases muy pequeñas presentan inconvenientes, mientras que 
una base grande requiere la utilización de muchas cifras distintas y, 
en particular, una tabla de multiplicación extensa. La elección de doce 
como base ha sido defendida por muchos; como ventajas señalan que 
12 es divisible por 2, 3, 4 y 6, y, como consecuencia, el cálculo que im- 
plique divisiones y fracciones se sinplificaría frecuentemente. Para es- 
cribir un número en base doce (sistema duodecimal) se necesitan dos 
nuevas cifras para el 10 y el 11. Indiquemos el 10 con « y el 11 con $. 
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En el sistema duodecimal, «doce» se escribiría 10; «veintidós» sería 1a; 
«veintitrés» sería 18, y «ciento treinta y uno» se escribiría af. 

La invención de la «numeración relativa», atribuída a los sumerios 
o babilonios y desarrollada por los indios, fué de enorme trascenden- 
cia para la civilización. Los sistemas anteriores de numeración esta- 
ban basados en un estricto principio aditivo. En el simbolismo ro- 
mano, p. ej., se escribía 


CXVIII = 100 +4104+ 53+1+1+1. 


' Los sistemas egipcio, hebraico y griego eran de un tipo parecido al de 
los rómanos. Un inconveniente de la notación aditiva es que cuanto 
mayor es el número mayor es también el conjunto de nuevos símbolos 
necesarios para representarlo. (Claro está que los científicos antiguos 
no utilizaban las módernas magnitudes astronómicas o atómicas.) 
Pero el defecto fundamental de los antiguos sistemas, tales como el 
romano, residía en el hecho de que el cálculo era tan complicado que 
únicamente los especialistas podían manejar los problemas de cálculo 
no triviales. Las cosas pasan de modo distinto con el sistema indio de 
«valor relativo», hoy en uso. Este sistema fué introducido en Europa, 
en la Edad Media, por comerciantes italianos, quienes lo habían apren- 
dido de los árabes. Tiene la propiedad cómoda de que todos los nú- 
meros, grandes o pequeños, pueden representarse mediante un peque- 
ño conjunto de cifras diferentes (en el sistema decimal, mediante las «ci- 
fras árabes» 0, 1, 2, ..., 9). Esto lleva consigo la importante ventaja de la 
facilidad de-los cálculos. Las reglas de cálculo en los sistemas de nota- 
ción basados en el valor relativo pueden establecerse en forma de tablas 
de adición y multiplicación para números de una sola cifra y pueden ser 

_ aprendidas de memoria y retenidas para siempre. Existen pocos ejem- 
plos de adelantos científicos que hayan afectado tan profundamente y 
facilitado tanto la vida diaria como el actual sistema de numeración. 

3. El cálculo numérico en sistemas distintos del decimal.—El uso 
del 10 como base de numeración se remonta a los primeros tiempos de 
la civilización, y es debido indudablemente al hecho de que son diez 
los dedos con los que se acostumbra contar. Sin embargo, las palabras 
que sirven para designar algunos números en distintos idiomas pare- 
cen reminiscencias del uso de otras bases, especialmente 12 y 20. En 
inglés y en alemán las palabras para 11 y 12 no están construídas 
según el principio decimal de combinar 10 con los números de una cifra, 
como ocurre para los comprendidos entre 13 y 19, sino que son lin- 
gúisticamente independientes de la palabra que corresponde a 10. En 
francés las palabras vingt y quatre-vingt, para 20 y 80, sugieren la idea 
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de que para algunas cuestiones se haya usado un sistema de base 20. 
En danés, la palabra halvfirsindstyve, para 70, significa a medio ca- 
mino (a partir de tres veces) de cuatro veces veinte. Los astrónomos 
de Babilonia utilizaban un sistema que en parte era sexagesimal 
(base 60); la creencia en este hecho se apoya en la habitual división 
de la hora y del grado angular en 60 min. 

En un sistema distinto del decimal, las reglas de la aritmética son 
las mismas que en éste; sin embargo, han de usarse otras tablas para 
la adición y la multiplicación de los números de una cifra. Acostum- 
brados al sistema decimal y ligados a él por gran número de palabras 
de nuestro lenguaje, surge al comienzo alguna confusión. Ensayemos 
un ejemplo de multiplicación en el sistema septimal; antes será con- 
veniente escribir las tablas de sumar y multiplicar que usaremos 
en la operación: 


Adición Multiplicación 





1 2 
2 3 
3 4 
4 5 
5 6 
6 0 
0 1 





Sea multiplicar 265 por 24, símbolos que representan números en 
el sistema septimal. (En el sistema decimal sería equivalente a mul- 
tiplicar 145 por 18.) Las reglas de la multiplicación son las mismas 
que en el sistema decimal. Comenzamos multiplicando 5 por 4, que 
da 26, como resulta de la tabla de multiplicar. l 

265 
24 
1456 
563 
10416 


Escribimos 6 en el lugar de las unidades: y «llevamos» 2 al lúgar 
de las septenas. Luego buscamos 4 + 6 = 33, y 33 + 2 = 35. Escri- 
bimos 5, y procedemos de igual forma hasta que hayamos multipli- 
cado todos los números. Sumando 1456 + 5630, se obtiene 6 + 0 = 6 
en el lugar de las unidades, 5 + 3 = 11 en el lugar de las septenas. 
De nuevo escribimos 1 y conservamos 1 para el lugar de los cuarenta 
y nueves, con lo que tenemos 1 + 6 + 4 = 14, El resultado final es: 
265 - 24 = 10416. 
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Para comprobar este resultado, podemos multiplicar los mismos 
números en el sistema decimal. 10416 (en el sistema septimal) puede 
escribirse en el sistema decimal calculando las potencias de 7 hasta 
la cuarta: 7? = 49, 7% = 343, 71 = 2401. De donde 10416 = 2401 + 
+4- 49 +7 +6; este cálculo está hecho en el sistema decimal. Suman- 
do estos números, resulta que 10416 en el sistema septimal es igual a 
2610 en el sistema decimal. Luego, multipliquemos 145 por 18 en el sis- 
tema decimal; el resultado es 2610, lo que confirma el cálculo anterior. 


Ejercicios: 

1. Constrúyanse las tablas de adición y multiplicación en el sistema duode- 
cimal y háganse algunos ejemplos en este sistema. 

2. Exprésense «30» y «136» en los sistemas de bases, 5, 7, 11 y 12. 

3. ¿Qué representan los símbolos 11111 y 21212 en dichos sistemas? 

4. Fórmense las tablas de adición y multiplicación en los sistemas de bases 
5, 11 y 13. 

El sistema de valor relativo de base 2 está caracterizado por ser 
el de base más pequeña. Las únicas cifras en este sistema diádico 
son O y 1; cualquier otro número z vendrá representado por una suce- 
sión de estos dos símbolos. Las tablas de adición y multiplicación se 
reducen a las reglas 1 + 1 = 10 y 1-1=1. El inconveniente de 
este sistema es evidente; hacen falta expresiones muy largas para 
representar números pequeños. Así, 79, que puede expresarse en la 
forma 1 - 240-254 0-24 1-234+1-22+1+24+ 1, se escri- 
be en el sistema diádico 1001111. 

Como ilustración de la sencillez de la multiplicación en el sistema 
diádico haremos la multiplicación de 7 por 5, números que se repre- 
sentan respectivamente por 111 y 101. Recordando que en este sis- 
tema se tiene 1 + 1 = 10, resulta: 


111 
101 


111 
111 


100011 = 25 +2 +1, 
es decir, 35, como debía ser. 

Gottfried Wilhelm Leibniz (1646-1716), una de las mayores inte- 
ligencias de su tiempo, fué un apasionado del sistema diádico. A pro- 
pósito de esto, Laplace escribe: «Leibniz veía en el sistema diádico la 
imagen de la creación. Consideraba que la unidad representaba a Dios, 
y el cero, la nada; que el Ser Supremo creaba todos los seres de la 
nada, del mismo modo que la unidad y el cero expresaban todos los 
números de su sistema de numeración». 
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Ejercicio: Considérese la cuestión de representar los enteros en la base a. Para 
_nombrar los enteros en este sistema se necesitan palabras para los números 0, 
1, ..., a — 1 y para las sucesivas potencias de a: a, a?, a?, ... ¿Cuántas palabras dis- 
tintas son necesarias para designar todos los números de 0 a 1000, para a = 2, 
3, 4, 5, ..., 15? ¿En qué base son necesarias menos palabras? (Ejemplos: Si a = 10, 
se necesitan diez palabras para los números de una cifra, además de las palabras 
para 10, 100 y 1000, lo que hace 13 en total. Para a = 20, se necesitan veinte para 
los números de una cifra, más las correspondientes a 20 y 400; en total, 22, Si 
es a = 100, se necesitan 101.) 


*I. LA INFINITUD DEL SISTEMA DE NÚMEROS ENTEROS. 
INDUCCIÓN MATEMÁTICA 





1. El principio de inducción matemática.—La sucesión de enteros 1, 
2,3, 4, ..., no tiene fin, puesto que después de cada entero n hay uno 
siguiente: el n + 1. Expresaremos esta propiedad diciendo que la suce- 
sión de enteros contiene infinitos enteros. La sucesión de enteros cons- 
tituye el ejemplo más sencillo y natural del infinito matemático, el cual 
desempeña un papel dominante en la matemática. A lo largo de este li- 
bro necesitaremos manejar colecciones o conjuntos que contienen una 
infinidad de objetos matemáticos; p. ej., el conjunto de todos los pun- 
tos de una recta o el conjunto de todos los triángulos de un plano. 
La sucesión de enteros es el ejemplo más simple de conjunto infinito. 

El proceso de ir paso a paso, de n a n + 1, que engendra la suce- 
sión infinita de los enteros, forma también la base de uno-de los tipos 
fundamentales de razonamiento matemático: el principio de inducción 
matemática. La inducción empírica de las ciencias naturales procede 
de una serie particular de observaciones de un cierto fenómeno para 
establecer una proporción o ley general qué debe regir todas las. posi- 
bilidades del fenómeno. El grado de certeza con que se establece dieha 
ley depende del número de observaciones particulares y de confirma 
ciones del fenómeno. Este tipo de razonamiento inductivo es con fre- 
cuencia plenamente convincente; la predicción de que mañana el Sol 
hará su salida por Oriente tiene toda la certeza posible; pero el 
carácter de esta proposición no es el mismo que el de un teorema pro- 
bado con razonamientos estrictamente lógicos o matemáticos. 

De modo completamente distinto se utiliza la inducción matemática 
para establecer la certeza de un teorema matemático en una suce- 
sión infinita de casos: el primero, el segundo, el tercero, y así sucesi- 
vamente, sin excepción. Designemos con 4 una proposición que se 
refiera a un entero arbitrario n; p. ej., A puede ser la proposición: «La 
suma de los ángulos de un polígono convexo de n + 2 lados es n ve- 
ces 1800.» A’ puede consistir en la afirmación: «Trazando n rectas en 
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un plano no se puede dividir éste en más de 22 partes.» Para probar 
uno de estos teoremas para cualquier entero n no es suficiente pro- 
barlo para los 10 ó 100, ni aun para los 1000 primeros valores de n. 
Este modo de proceder correspondería precisamente a la inducción 
empírica. En su lugar, debemos usar un método estrictamente mate- 
mático y no un razonamiento empírico, cuyo carácter indicaremos en 
lo que sigue, al probar lós ejemplos especiales A y A”. En el caso A 
sabemos que para n = 1 el polígono es un triángulo, y por geometría 
elemental se sabe que la suma de sus ángulos es 1 - 180%, Para un cua- 
drilátero, n = 2, se traza una diagonal que dividirá al cuadrilátero en 
dos triángulos. Entonces se ve, de modo inmediato, que la suma de 
los ángulos del cuadrilátero es igual a la suma de los ángulos de los 
dos triángulos, lo que da 1800 + 1800 = 2 - 1800, Procediendo análo- 
gamente para el pentágono, n = 3, se descompone en un triángulo y 
un cuadrilátero. Puesto que la suma de los ángulos del último es 
2 - 180%, como acabamos de probar, y siendo la suma de los ángulos 
del triángulo 1800, obtenemos para el pentágono 3 - 180%, Ahora bien: 
resulta claro que podemos proceder indefinidamente en la misma forma, 
probando el teorema para n = 4; luego, para n = 5, y así sucesivamen- 
te. Cada proposición se deduce de la precedente en la misma forma, 
de modo que el teorema general puede ser establecido para todo n. 

Análogamente podemos probar A”; para n = 1 es evidente, ya que 
una recta divide al plano en dos partes. Añadamos una segunda recta. 
Cada una de las partes anteriores quedará dividida en dos nuevas 
partes, salvo que la nueva recta sea paralela a la primera. En ambos 
` casos, para n = 2 no resultan más de 4 = 2? partes. Añadamos una 
tercera recta; cualquiera de las regiones anteriores quedará, o bien 
dividida en dos partes o sin dividir. Así, la suma de partes no podrá 
ser.mayor que 2 - 22 = 23, Sabiendo que esto es cierto, podemos pro- 
bar el caso siguiente en la misma forma, y así indefinidamente. 

La idea esencial:de los argumentos precedentes consiste en esta- 
blecer un teorema general A para todos los valores de n, probando 
sucesivamente una sucesión de casos especiales Á, Az, ... La posibi- 
lidad de hacerlo depende de dos hechos: a) Existe un método general 
para probar que si cualquier proposición Ar es cierta, la proposición 
siguiente, Ar, 1, será también cierta. b) Se sabe que la primera pro- 
posición. A es cierta. Que estas dos condiciones son suficientes para 
establecer la verdad de todas las proposiciones Ay, Az, Az, ..., €S UN 
principio lógico que resulta tan fundamental para las matemáticas 
como lo:son las reglas clásicas de la lógica aristotélica. Por ello vamos 
a enunciarlo explícitamente como sigue: 
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Supongamos que queremos establecer una sucesión infinita de pro- 


posiciones matemáticas 
Ay As Ag... 


que juntas constituyen una proposición general A. Supongamos: a) que 
por un razonamiento matemático se prueba que, si r es un entero cual- 
quiera, de la verdad de la proposición A+ se sigue la verdad de la Ar,1, 
y b), se sabe que la proposición A, es cierta. Entonces todas las propo- 
siciones de la sucesión son ciertas y queda probada A. 

No debe haber duda en aceptar esto, del mismo modo que no la 
tenemos para aceptar las reglas elementales de la lógica ordinaria, 
como un principio del razonamiento matemático, ya que se puede 
establecer la verdad de cualquiera de las proposiciones An partiendo 
de la aserción b) de que A, es cierta, y procediendo por uso repetido 
de la aserción a), para establecer sucesivamente la verdad de A, Aj, 
A, y así hasta llegar a la proposición An. El principio de inducción 
matemática se basa en el hecho de que después de cada entero r hay 
un siguiente r + 1, y que todo entero n puede ser alcanzado me- 
diante un número finito de pasos, a partir del 1. 

Con frecuencia, el principio de inducción matemática se aplica 
sin mencionarlo explícitamente, o viene indicado simplemente por 
un «etc.» o un «y así sucesivamente». Así sucede, en particular, en la 
enseñanza elemental. Pero el uso explícito del razonamiento inductivo 
es indispensable en demostraciones más sutiles. Damos a continuación 
algunos ejemplos de carácter sencillo, pero no trivial. 

2. Progresiones aritméticas.—Para todo valor de n, la suma 
Ue Ed . Para 

2 
; prabar. este teorema por inducción matemática debemos demostrar 
que para cualquier n la proposición An: 


1 +2 +3... + n de los n primeros enteros es igual a 


n(n 1 
A n m ED 1 


es cierta. a) Observemos que si r es un entero y si se sabe que la pro- 
posición Ar es cierta; es decir, si sabemos que 
r(r + 1) 


0] » 





142434. +1= 


sumándole el número (r + 1) a los dos miembros de esta igualdad 
obtenemos la ecuación 
r(r +1) (r+ 1) (tr +2) 


2 +r + 1). 3 





1+42+3+.+r+(14+1)= 
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que es precisamente la proposición Ar,1. b) La proposición A, es evi- 
-2 
dente, ya que 1 = "z De donde, por el principio de inducción 


matemática, la proposición An es cierta para todo n, como se quería 
demostrar. 

Corrientemente se suele probar escribiendo la suma 1. + 2 + 3 + 
+ ... +n de dos maneras: 


Sa=1+2+..+(R-1)+nm 


y 
Sa=n + (n- 1)+..+2+1. 


Al sumar, se observa que cada par de números de la misma columna 
da como suma n + 1, y puesto que hay n columnas en total, se sigue 


287 = n(n + 1), 


lo que prueba el resultado indicado. 
De (1] se puede deducir de modo inmediato la fórmula de la suma 
de los (n + 1) primeros términos de cualquier progresión aritmética, 


{n + 1) Qa + nd) 


Pa =a + (a + d) + (a + 2d) +... + (a + nd) = 3 [2] 
Puesto que 
n(n + 1)d 
Pa = (n + a+ (1+2 +... + md =(n + 1a + 32 = 


_ Any la + mn + id (n+1)(a + nd) 
y 2 E 2 
Para el caso a = 0 y d = 1, esta fórmula es la misma [1]: 

3. Progresiones geométricas.—Se pueden estudiar las progresio- 
nes geométricas de modo análogo al precedente. Probaremos que para 
todo valor de n se tiene 
1 — gq 

l—q i 
(Suponemos q % 1, ya que de otro modo el último miembro de [3] 
no tendría significado.) 

La proposición es cierta para n = 1, ya que entonces 
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Gn= a + aq + ug? + ... + ag? = a 


at= g A+A- 
t=a (1-9) 
Y si suponemos que se tiene 





G, = a + ag = = a(1 + 9). 


1 — qg 
1-4 





Gr =a + Q z- ... + agt =a 
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resulta como consecuencia 
pan gres 














1 . 
Gr, = (a + aq +... + aq?) + aque = Gr + aqgrt = a i + aquél = 
~q 
(1 — q+) + g1 — q) 1 — gt 4 gt — grts 1 — qr+ 
S t= 7f 1—4 DEET 


Pero esto es precisamente la proposición [3] para el caso n=r +1, 
lo que completa la demostración. 
En los libros elementales, la prueba habitual procede como sigue. 
Pongamos 
Gn =a + aq +... + aqh, 
y multipliquemos los dos miembros por q. Se obtiene 
qGa = q + aq +... + aquél, 


Restando entonces los miembros correspondientes de las dos igual- 
dades, resulta 

Gn — Gn = 4,— aqat, 

(1 — Gn = a(l — q+), 


f q“ 





Gn = 
n ey 





4. Suma de los «n» primeros cuadrados.—Otra interesante aplica- 
ción del principio de inducción se refiere a la suma de los n primeros 
cuadrados. Mediante ensayos directos se encuentra, 'al menos para 
valores pequeños de n, 

n(n + 1) (2n + 1) 
6 

y se supone que esta fórmula pueda ser válida para todos los enteros n. 

Para probarlo, haremos uso de nuevo del principio de inducción. Co- 

menzaremos por observar que si la proposición Au, que en este caso 

coincide con la ecuación [4], es válida para el caso n = r, de modo 

que se tenga 


1204 224 384. + n= [4] 


r(r + 1) (2r +1) 


E A rI > 


sumando (r + 1)? a los dos miembros de esta igualdad se obtiene 


1 1 
nr + 1) (2r + a 


14224 384+...4+/1?4(r +1) = r r+1}= 
MAUI + 6(r +1) _ (r+ 1) [n(2r + 1) + 6(r + 1) 
6 E 6 B 


_ (r +1)(2r?+7r +6) (r + 1) (r + 2) (2r + 3) 
j 6 mi 6 : 
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que es precisamente la proposición Ar,1 en el caso presente, puesto 
que se obtiene sustituyendo n por r + 1 en [4]. Para completar la 
demostración necesitamos únicamente observar que la proposición Ay, 
en este caso la ecuación 


sp 104 DO+0 
6 , 


es evidente. Por tanto, la ecuación [4] es válida para cualquier n. 

Fórmulas análogas pueden hallarse para potencias superiores de 
los enteros, 1: + 2x + 31 + ... + ne, donde k es un entero positivo 
cualquiera. Como ejercicio, el lector puede probar, mediante induc- 
ción matemática, que 

2 
18 + 224 334... H n? = Fe] [5] 

Debe observarse que, si bien el principio de inducción matemática 
es suficiente para probar la fórmula [5] una vez que se conoce ésta, la 
demostración no da indicación alguna sobre el modo en que dicha 
fórmula puede encontrarse; es decir, sobre el por qué debe suponerse 
la expresión [n(n + 1)/2]? como resultado para la suma de los n pri- 
meros cubos, en vez de la [n(n + 1)/3]2 o (19n2 — 41n + 24)/2 o cual- 
quiera de las infinitas expresiones análogas que pudieran ser conside- 
radas. El hecho de que la demostración de un teorema consista. en la 
aplicación de ciertas reglas sencillas de lógica no disminuye el valor 
del elemento creador en matemáticas, el cual desempeña su papel en 
la elección de las posibilidades que deban ser tenidas en cuenta. La 
cuestión del origen de la hipótesis [5] pertenece a un dominio en el cual 
no pueden ser dadas reglas generales; ensayos, analogías e intuición 
constructiva tienen en esto papel importante. Pero una vez formu- 
lada correctamente la hipótesis, el principio de inducción matemática 
es con frecuencia suficiente para dar la demostración. En tanto que 
una demostración no proporcione una indicación para el acto del des- 
cubrimiento, debe llamarse más propiamente una comprobación. 

*5. Una desigualdad importante.—En otro capítulo haremos uso 
de la desigualdad 


(1 +p» >1+np;, [6] 


que es válida para todo número p > —1 y todo entero positivo n. 
(Con objeto de dar mayor generalidad, anticipamos aquí el uso de 
números negativos no enteros admitiendo como p cualquier número 
mayor que —1. La demostración en el caso general es exactamente 
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la misma que en el caso en que p es un entero positivo.) Usaremos de 
nuevo la inducción matemática. 

a) Sies cierto que (1 + p)! > 1 + rp, multiplicando los dos miem- 
bros de esta desigualdad por el número positivo 1 + p se obtiene 


(1 + p+ >1+rp+p+rp. 
Si prescindimos del término positivo rp?, se tendrá 
(1 +p)! >1+(r+1)p, 


lo que prueba que la desigualdad [6] vale también para el entero 
siguiente r + 1. b) Evidentemente se tiene: (1 + p) > 1 + p. Esto 
completa la demostración de que [6] es cierta para todo n. La res- 
tricción de que p > —1 es esencial. Si es p < —1, 1 + p es negativo 
y el razonamiento empleado para a) deja de ser válido, puesto que 
si se multiplican los dos miembros de una desigualdad por un número 
negativo, la desigualdad cambia de sentido. (P. ej., si multiplicamos 
los dos miembros de la desigualdad 3 > 2 por —1, obtendríamos 
—3 < —2.) 

*6. El binomio de Newton.—Con frecuencia es importante tener 
una expresión explícita para la n-ésima potencia de un binomio, 
(a + b)». Mediante cálculo explícito se obtiene: 


para n=1, (a+ bd) =aw+20b. 
para n=2, (a+ b} = (a + b) (a + b) = a(a + b) + da + b) = 
= a? + 2ab + b, 
para n = 3, (a + by = (a + b)(a + b} = a(a? + 2ab + b!) + 
+ b(a! + 2ab + b?) = a? + 3a% + 3ab? + D, 


y así sucesivamente. Cuál es la ley general de formación, implícita 
en la frase «y así sucesivamente»? Examinemos el proceso mediante el 
cual calculamos (a + b)?. Puesto que es (a + b)* = (a + b) (a + b), 
se obtiene el desarrollo de (a + b)! multiplicando primero cada tér- 
mino de la expresión a + b por a y luego por b y sumando después. 
El mismo procedimiento se utilizó para calcular (a + b)? = (a + b) 
(a + b)’. Se puede continuar del mismo modo para calcular (a + b)‘, 
(a + b), y así indefinidamente. La expresión de (a + b)” se obten- 
dría multiplicando cada uno de los términos de la expresión de 
(a + b)a1, calculada previamente, primero por a y luego por b, y 
sumando. Esto conduce al diagrama 
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a+b = a + b 
oo 
(a + Di = 2ab 
EN ÓN E 
ua + db = 3ath +  3ab* 
/N DA ZNN 
(a + b} = at + 4ab + 6amb% + 4ab + bt 


el cual da inmediatamente la regla general para formar los coeficien- 
tes del desarrollo de (a + b)”. Para ello construímos un esquema 
triangular de números, partiendo de los coeficientes 1, 1 de a + b, 
y de tal modo que cada número del triángulo es la suma de los dos 
números inmediatos a él en la fila precedente. Esta disposición de los 
números es conocida con el nombre de triángulo de Pascal. 


La fila n-ésima de este esquema da los coeficientes del desarrollo de 
(a + b)” según las potencias decrecientes de a y las crecientes de b; así 


(a + dy = a? + 7a*b + 21a'b*% + 35a8b* + 35a%%bt + 21a*bB + 7ab* + b. 


Usando una notación concisa, mediante índices y subíndices, se pueden 
representar los números de la n-ésima fila del triángulo de Pascal por 


C = 1, Cì, C} C3, -o Cap Ch = 1. 
Entonces, la fórmula general para (a + b)» puede escribirse 
(a + by = an + Canto + Chan=8b2 +... + Chabe- 4- bn, [7] 
De acuerdo con la ley de formación del triángulo de Pascal, se tiene 
G = cda + an. (8) 


Como ejercicio, el lector puede utilizar esta relación, junto con el 
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hecho de que C} = C} = 1, para probar, mediante inducción ma- 
temática, que 


nn — 1)(n-2)...(n—i+1) n! 


n_ EP 
Gim 1:2-3.. 1 ia — ii (91 


(Para todo entero positivo n, el símbolo ni—léase «factorial de 
n»—desigua el producto de los n primeros enteros: n! =1+2-3---n. 
Y resulta conveniente definir también 0! por la igualdad 0! = 1; de 
este modo [9] es válido para i = 0 e i = n.) Esta fórmula explícita 
para los coeficientes del desarrollo binómico se conoce con el nombre de 
teorema del binomio. (Véase también Cap. VIII, Suplemento, III, 1.) 


Ejercicios: Demuéstrese por inducción matemática: 





i 1 1 1 n 

a AED ni 
1 2 3 n n+2 

2. tata tetan? 25 


1 — (n + 1)q2 + ngat 
(1-q* 
1—7" 


*3. 1 + 2g + 3g ++. + nge = 
"M AHDOD HA I 
Hállese la suma de las siguientes progresiones geométricas: 


1 


5. 1 getapt t (1 + xs)n 
sä x x? S xn 
Cta tara aa 


y a — yy” ny" 
a a (5) 
Utilizando las fórmulas [4} y (5], pruébese: 


(n + 1) (2n + 1)(2n + 3) 


3 


+9, 184 334 ...4+ (2n +1) = (n+ 12n? + 4n + 1). 


8, 124 33+..+(Qn+1M= 


10. Demuéstrense los mismos resultados directamente por inducción mate- 
mática. 


+7. Algunas observaciones a propósito de la inducción matemática.—El prin- 
cipio de inducción matemática puede modificarse un poco y darle la siguiente forma: 
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«Si una sucesión de proposiciones As, Ayy1, As+2, ..., donde s es:un entero po- 
sitivo, es tal que: 

a) para todo r > s, de la verdad de Ar se sigue la de Ar+1, y 

b) se sabe que As es cierta, 
entonces todas las proposiciones As, Azy1, Ag+2, .... SON ciertas; es decir, An es cierta 
para todo ri > s.» Se aplica aquí el mismo razonamiento utilizado para establecer 
la validez del principio ordinario de inducción matemática, con la única variante 
de sustituir la sucesión 1, 2, 3, ... por la sucesión análoga, s$, s + 1, s + 2, ... Usan- 
do el principio en esta forma, se puede precisar más la desigualdad de la página 22, 
eliminando la posibilidad del signo «=». Se puede probar que: Para todo p Æ 0 
y > —1 y para todo entero n > 2, 


(1 + p)>1+mnp. [10] 


Dejamos la demostración al cuidado del lector. 

Íntimamente ligado con el principio de inducción matemática está el llamado 
«principio del menor entero», el cual establece que todo conjunto C, no vacio, de 
números enteros positivos contiene un entero menor que todos los demás. Un con- 
junto vacío es aquel que no contiene elementos; p. èj., el conjunto de las circun- 
ferencias rectilíneas o el conjunto de los enteros n tales que n > n. Por razones 
obvias excluímos tales conjuntos de nuestro principio. El conjunto C puede ser 
finito, tal como el conjunto 1, 2, 3, 4, 5, ó infinito, como el conjunto de todos los 
números pares 2, 4, 6, 8, 10, ... Cualquier conjunto C, no vacío, debe contener 
cuando menos un entero, p. ej., el n, y entonces el más pequeño de los enteros 1, 
2, 3,..., n, que pertenezca a C será el menor de los enteros contenidos en C. 

Para comprender bien el significado de este principio se debé observar que 
deja de ser cierto si se aplica a cualquier conjunto C.de:números que no sean en- 
teros; p. ej., el conjunto de fracciones positivas 1, 1/3 1/3, ... no contiene una frac- 
ción menor que todas las demás. 

Desde el punto de vista de la SRE es interesante observar que el principio 
del menor entero puede ser utilizado para demostrar el principio de inducción 
matemática como un teorema. Con tal objeto, consideremos cualquier sucesión 
de proposiciones A,, Ay, Ay, ... tales que: 

a) Para todo entero positivo r, la verdad de Ar, se sigue de la de Ar. 

b) Se sabe que A, es cierta. 

Probaremos que la hipótesis de que cualquiér A sea falsa es absurda. Pues si 
alguna de las A fuese falsa, el conjunto C de todos los enteros positivos n para 
los cuales fuera falsa An sería un conjunto no vacío. Por el principio del menor 
entero, C contendría un entero p más pequeño que todos los demás, y p debería 
ser > 1 a causa de b). Por tanto, se tendría que Ap sería falsa mientras que Ap-., 
sería cierta; pero esto contradice a). 


Una vez más insistimos en que el principio de inducción matemá- 
tica es completamente diferente de la inducción empírica de las cien- 
cias naturales. La confirmación de una ley general en cualquier nú- 
mero finito de casos, por grande que sea dicho número, no suministra 
una demostración de la ley en sentido matemático riguroso, y esto 
aunque no sea conocida excepción alguna. Tal ley quedará únicamente 
como una hipótesis plausible, sujeta siempre a modificaciones por los 


SEG. II]  INFINITUD DEL SISTEMA DE NÚMEROS ENTEROS 27 





resultados de ulteriores experiencias. En matemáticas, una ley o un 
teorema quedan probados únicamente cuando se demuestra que son 
una consecuencia lógicamente necesaria de ciertos supuestos admitidos 
como válidos. Existen varios ejemplos de proposiciones matemáticas 
que hán sido comprobadas en todos los numerosos casos particulares 
considerados, pero que hasta la fecha no han sido demostradas en 
general (para un ejemplo, véase pág. 38). Se puede sospechar que un 
teorema es cierto en general si resulta cierto en un número de ejem- 
plos; entonces cabe intentar probarlo mediante la inducción mate-. 
mática. Si el intento tiene éxito, el teorema queda demostrado; si se 
fracasa, el teorema puede ser cierto o falso y algún día podrá, posi- 
blemente por otros métodos, ser probado o rechazado. 


Al usar el principio de inducción matemática se debe estar seguro de que las 
condiciones a) y b) están efectivamente satisfechas. Descuidar esta precaución 
puede conducir a absurdos -como el que sigue (invitamos al lector para. que des- 
cubra el error en el razonamiento). «Probaremos» que dos enteros positivos cuales- 
quiera son iguales; p. ej., que 5 = 10. 

Comenzamos con una definición: Si a y b son dos enteros positivos desiguales, 
definimos como máx. (a, b) aquel de los dos que sea mayor: si es a = b pondre- 
mos máx. (a, b) = a = b. Así máx. (3, 5) = máx. (5, 3) = 5, mientras que máx. 
(4, 4) = 4. Sea ahora An la proposición: «Si a y b son dos enteros positivos cua- 
lesquiera, tales que máx. (a, b) = n, se tiene a = b.» 

a) Supongamos que Ar es cierta. Sean a y b dos enteros positivos cuales- 
quiera, tales que máx. (a, b) =r + 1. Consideremos los dos enteros 


=a-1 


B=b-—1; 


se tendrá entonces: máx. (a, B) = r. De aquí resulta œ = ß, puesto que suponia- 
mos que A, era cierta. De donde se sigue a = b; en consecuencia, Ary, es cierta. 

b) A, es evidentemente cierta, pues si es máx. (a, b) = 1, se tendrá, ya que 
suponemos a y b enteros positivos, que estos dos números deben ser iguales a 1. 
Por consiguiente, en virtud de la inducción matemática, An es cierta para todo n. 

Ahora, si a y b son dos enteros positivos cualesquiera, designemos máx. (a, b) 
por r. Puesto que hemos probado que A, es cierta para todo n, se tendrá en par- 
ticular que Ar es cierta. En consecuencia a = b. 


SUPLEMENTO AL CAPÍTULO PRIMERO 
TEORÍA DE NÚMEROS 


Introducción.—Los enteros fueron poco a poco perdiendo su rela- 
ción con supersticiones y misticismos, pero su interés para los mate- 
máticos no disminuyó nunca. Euclides (hacia el año 300 a. de J.C.), 
cuya fama está ligada a la parte de sus Elementos que forma la base 
de la geometría elemental, parece haber obtenido resultados origina- 
les en la teoría de números, mientras que su geometría es, en su ma- 
yor parte, una compilación de resultados anteriores. Diofanto de Ale- 
jandría (hacia el año 275 d. de J.C.), uno de los primeros algebristas, 
dejó huella importante en la teoría de números. Pierre de Fermat 
(1601-1665), jurista en Toulouse y uno de los más grandes matemá- 
ticos de su tiempo, inició las investigaciones modernas en este campo. 
Euler (1707-1783), el más prolífico de los matemáticos, obtuvo gran 
cantidad de resultados en la teoría de números entre sus investiga- 
ciones matemáticas. Otros nombres preeminentes en los anales de la 
matemática—Legendre, Dirichlet, Riemann—deben añadirse a la lista 
anterior. Gauss (1777-1855), el más célebre matemático de los tiem- 
pos modernos, dedicado asimismo a distintas ramas de las matemá- 
ticas, resumió su opinión sobre la teoría de números en la frase: «La 
matemática es la reina de las ciencias, y la teoría de números es la 
reina de las matemáticas.» 


I. LOS NÚMEROS PRIMOS 


1. Hechos fundamentales.—La mayor parte de las proposiciones 
de la teoría de números, como en general de la matemática, no se 
refieren a un objeto particular—el número 5 ó el número 32—, sino 
a una clase completa de objetos que tienen alguna propiedad común; 
p. ej., la clase de todos los números pares: 


2, 4. 6, 8,..., 
o la clase de los enteros divisibles por 3: 
3, 6, 9, 12, ...,. 
o bien la clase de los cuadrados de los números enteros: 


1,4, 9, 16, 
y así sucesivamente. 


28 
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De fundamental importancia en teoría de números es la clase de 
los números primos. Casi todos los enteros se pueden descomponer 
en producto de factores. más pequeños: 10 =2-+ 5, 111 =3- 37, 
144 =3+3-+2- 2-2: 2, etc. Los números que no pueden descom- 
ponerse de este modo se llaman números primos o simplemente pri- 
mos. Con más precisión, un número primo es un entero p, mayor que 
uno, que no admite más factores que él mismo y la unidad. (Se dicé que 
un entero a es factor o divisor de otro entero b si existe otro entero c 
tal que b = ac.) Los números 2, 3, 5, 7, 11, 13, 17, ... son primos, 
mientras que 12, p. ej., no es primo, ya que se tiene 12 = 3 + 4. La 
importancia de la clase de los números primos se debe al hecho de 
que cualquier entero puede expresarse como producto de números pri- 
mos: si un número no es primo, se puede descomponer sucesivamente 
hasta que todos sus factores sean primos; p. ej., 360 = 3 - 120 = 
=3:30:4=3:3:-10:2:2=3:-3:5:2:2:2=2%+ 32. 5, 
Un entero (distinto de O y 1) que no sea primo se llama compuesto. 

Una de las primeras cuestiones que se presentan en la teoría de los 
números primos es la de saber si hay solamente un número finito de 
estos números o si, por el contrario, la clase de los números primos 
tiene infinitos elementos distintos, como ocurre con la clase de los 
números enteros de la cual forma parte. La respuesta es: Existen infi- 
nitos números primos. 

La prueba de la infinitud de la clase de los números primos dada 
por Euclides ha quedado como modelo de razonamiento matemático. 
Procede por «reducción al absurdo», y parte de la hipótesis de que el 
teorema es falso. Esto significa que existiría únicamente un número 
finito de números primos, quizá muchos (p. ej., un millón) o, dicho 
de un modo general, n. Usando subíndices, podríamos indicar dichos 
números primos por P,, Pz, ..«, Pn. Cualquier otro entero sería com- 
puesto y debería ser divisible por uno al menos de los py, P», ...» Pn- 
Vamos a ver que dicha hipótesis nos lleva a una contradicción; para 
ello, construyamos un número A que será distinto de los primos 
Pis Pss -s Pn por ser mayor que ellos y que, sin embargo, no será divi- 
sible por ninguno de los p. Tal número es el l 


A = PPr- Pnt 1. 


es decir, se obtiene añadiendo 1 al producto de todos los números 
primos que suponíamos existentes. A es distinto de los p y, por tanto, 
debe ser compuesto. Pero dividiendo A por p,, o por ps etc., se ob- 
tiene siempre de resto 1; en consecuencia, A no admite ningún p 
como divisor. Puesto que nuestra hipótesis inicial de que había sólo 
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un número finito de números primos nos conduce a una contradic- 
ción, dicha hipótesis es absurda y, por tanto, la contraria debe ser 
cierta; esto prueba el teorema. 

Aunque la demostración es indirecta, puede modificarse fácilmente para dar 
un método constructivo, al menos teóricamente, de una sucesión infinita de nú- 
meros primos. Partiendo de un número primo cualquiera, p. ej., p, = 2, supon- 
gamos que hemos encontrado n primos p,, Pz, Pa, -».» Pn; Observemos entonces que 
el número p,Py ... Pn + 1, O bien es primo o contiene factores primos que han de 
ser distintos de los n hallados previamente. Puesto que estos factores pueden 
hallarse por ensayos directos, estamos seguros de que, en todo caso, hay al menos 
un nuevo factor primo pn+,; procediendo de este modo se ve que la sucesión de 
los números primos construíbles no tiene fin. 

Ejercicio: Llévese a efecto dicha construcción a partir de p, = 2, P, = 3 y 
obténganse 5 números primos más. 

Si un número ha sido expresado como producto de números pri- 
mos, podemos disponer dichos factores primos en un orden cual- 
quiera. La experiencia demostraría que, salvo la arbitrariedad en la 
ordenación, la descomposición de un número N en factores primos es 
única: Todo entero N, mayor que 1, puede descomponerse en producto 
de númetos primos, y solamente de una forma. Esta proposición parece 
a simple vista tan evidente que un profano podría inclinarse a admi- 
tirla sin prueba. Sin embargo, no es una trivialidad y la demostra- 
ción, aunque elemental, requiere algunos razonamientos sutiles. La 
demostración clásica, dada por Euclides, de este «teorema fundamen- 
tal de la aritmética» está basada en un método o «algoritmo» para el 
cálculo del máximo común divisor de dos números. Este método será 
considerado en la página 51. En vez de dicha demostración, daremos 
aquí otra de cosecha más reciente; más breve, pero quizá más artifi- 
ciosa que la de Euclides. Será un ejemplo típico de demostración indi- 
recta. Supondremos la existencia de un entero susceptible de dos des- 
composiciones esencialmente diferentes, y de esta hipótesis resultará 
una contradicción. Esta contradicción demostrará que la hipótesis de 
que existe un entero con dos descomposiciones esencialmente diferen- 
tes en factores primos es absurda, y, como consecuencia, resultará que la 
descomposición en factores primos de un entero cualquiera es única. 

*Si existe un entero positivo capaz de descomponerse en dos pro- 
ductos esencialmente diferentes de primos, habrá uno menor que todos 
los demás para el que se verifique tal propiedad (véase pág. 26), 


M = Pipa ++» Pr = hha «+ Ys, 11] 
donde los p y los q son primos. Ordenando de nuevo, si es preciso, 
los p y los q, podemos suponer que se tiene 


Pi S Pa < +. < Prs qi <Q S- < Qo- 
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Ahora bien: p, no puede ser igual a q,, ya que en caso contrario, di- 
vidiendo los dos últimos miembros de [1] por p, = q,, se obtendrían 
dos descomposiciones esencialmente diferentes para un entero menor 
que m, en contradicción con la elección hecha de m como el entero 
más pequeño para el cual.ese hecho es posible. Por tanto, o bien es 
Pı < q, o se tiene q, < pı. Supongamos p, < q. (Si fuera q, < pı, bas- 
taría cambiar las letras p y q en lo que sigue.) Formemos el entero 


m’ = M -- {Pags -+ + 95). 121 


Sustituyendo m por las dos expresiones dadas por [1], podríamos es- 
cribir el entero m' en una de las dos formas 


m’ = (PPs: + -Pr) — (Paga: > -9a) = Pi(PrPa: - «Pr — Iaa: + 95) 13) 
mM’ = (Qa: - 95) — (Pigs + - 98) = (QU — Pr) (Qda: + + ~ 9a) [41 


Puesto que es pı < q, de [4] se sigue que m’ es un entero positivo, 
mientras que de [2] resulta que m’ es menor que m. De donde se 
deduce que, salvo el orden de los factores, la descomposición de m’ 
debe ser única. Pero de [3] resulta que p, es un factor de m’; por 
tanto, de [4] se concluye que p, debe aparecer como factor © del 
(q, — pı) o de (gfs -.. qs). (Esto resulta de suponer la descomposición 
única para m’; véase el razonamiento del párrafo siguiente.) La última 
hipótesis es imposible, porque p, es menor que todas las q. En con- 
secuencia, p, debe ser un factor de q, — pı, de modo que existirá un 
h tal que 


H-=P=pr:h 0. q=píh+1). 


Pero esto expresa que p, es un factor de q,, contrariamente al hecho 
de ser q, número primo. Esta contradicción prueba que nuestra hipó- 
tesis inicial era absurda y, por tanto, completa la demostración del 
teorema fundamental de la aritmética. 
Un corolario importante de este teorema fundamental es el siguiente: 
Si un número primo p es un divisor del producto ab, p debe ser factor 
de a o de b. Pues si p no fuera divisor de a ni de b, el producto de 
factores primos que da la descomposición de ab no contendría p. Por 
otra parte, puesto que se supone que p es un divisor de ab, existirá 
un entero t tal que 
ab = pl. 


En consecuencia, el producto de p por una descomposición en factores 
primos de t daría una descomposición de ab en factores primos, que 
contendría p, lo que estaría en contradicción con el hecho de que la 
descomposición en factores primos es única. 
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Ejemplos.—Si se ha comprobado de una parte que 13 es un divi- 
sor de 2652, y de otra que es 2652 = 6 - 442, se puede concluir que 
13 es un divisor de 442. Por el contrario, 6 es un factor de 240, y 
240 = 15-16; sin embargo, 6 no es factor de 15 ni de 16. Esto último 
prueba que la hipótesis de que p es primo es esencial para el corolario. 


Ejercicio: Para hallar todos los divisores de un número cualquiera a es sufi- 
ciente descomponer a en un producto 


a =p" : př.. : pr, 


donde las p son los distintos factores primos, cada uno de ellos elevado a una 
cierta potencia. Todos los divisores de a son los números 


b = ph . ps. .. p”, 
donde las B son enteros cualesquiera que satisfacen las desigualdades 


0<B<% 0<B<oa,».... 0 < Br <ar 


Demuéstrese esta proposición. Como consecuencia, pruébese que el número de 
divisores distintos de a (incluídos los divisores a y 1) viene dado por el producto 


(a, + 1) (a +1)... (ar + 1). 
Por ejemplo, 
144 = 21. 32 


tiene 5-3 divisores, que son: 1, 2, 4, 8, 16, 3, 6, 12, 24, 48, 9, 18, 36, 72 y 144. 


2. Distribución de los números primos.—Puede construirse una 
lista de todos los números primos menores que un entero N dado 
escribiendo primero ordenadamente todos los enteros menores que N, 
tachando después todos los que sean múltiplos de 2; luego, todos los 
restantes que sean múltiplos de 3, y así sucesivamente, hasta que ha- 
yan sido eliminados todos los números compuestos. Este proceso, co- 
nocido como la «criba de Eratóstenes», conserva en el tamiz los nú- 
meros primos menores que N. Tablas completas de números primos 
hasta 10 000 000 han sido calculadas mediante perfeccionamientos del 
método anterior; gracias a ellas se dispone de una masa imponente de 
datos empíricos referentes a la distribución y otras propiedades de los 
números primos. Sobre la base de estas tablas se han adelantado con- 
jeturas plausibles (del mismo modo que si la teoría de números fuese 
una ciencia experimental), muchas de las cuales resultan de demos- 
tración muy difícil. 

a) Fórmulas que dan números primos.—Se han hecho muchos in- 
tentos para obtener fórmulas aritméticas simples que dieran única- 
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mente números primos, aunque no se obtuvieran todos. Fermat hizo 
la famosa conjetura (no en forma de afirmación definitiva) de que 
todos los números de la forma 


F(n) = 29 41 


son primos. En efecto, para n = 1, 2, 3, 4 se obtiene 


F(1)=2Y+1>25, 
FQ)=2%41=2 41=17, 
F(3) = 2° 4 1 = 28 4 1 = 257, 
F(4) = 2 4 1 = 218 4 1 = 65 537, 


todos los cuales son números primos. Pero, en 1732, Euler obtuvo la 
descomposición 2* + 1 = 641 + 6 700 417; de donde resulta que F(5) 
no es primo. Más tarde se comprobó que otros de los «números de 
Fermat» eran compuestos, siendo necesarios para dichas comprobacio- 
nes métodos difíciles de la teoría de números, a causa de la insuperable 
dificultad de los ensayos directos. Hasta la fecha, no ha sido probado 
que sea primo ninguno de los números F(n) para n > 4. 

Otra sencilla y notable expresión que da varios números primos es 


Kn) =n —n +41. 


Para n = 1, 2, ..., 40 f(n) es primo; pero para n = 41, se tiene f(n) = 
= 412, que evidentemente no es primo. 
La expresión 
n* — 79n + 1601 


da primos para n' menor que 80, pero falla para n = 80. En resumen, 
puede decirse que la tarea de encontrar expresiones de tipo sencillo 
que den números primos ha resultado estéril. Ni que decir tiene que 
la posibilidad de obtener una fórmula algébrica simple que diera todos 
los números primos aparece como irrealizable. 

b) Números primos en una progresión aritmética.—Mientras que es 
muy sencillo demostrar que existen infinitos números primos en la 
sucesión de enteros 1, 2, 3, ..., la extensión de un resultado análogo 
para sucesiones tales como la 1, 4, 7, 10, 13, ... o la 3, 7, 11, 15, 19, ... 
o, más en general, para toda progresión aritmética, a, a + d, a + 24, ... 
a + nd, ..., donde a y d no tienen factores comunes, es bastante más 
complicada. Todas las observaciones parecen indicar el hecho de que 
en toda progresión de dicho tipo existen infinitos números primos, como 
ocurre para la progresión más simple: 1, 2, 3, ... El probar este teo- 
rema general requirió un gran esfuerzo. Lejeune-Dirichlet (1805-1859), 
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uno de los matemáticos más notables del siglo pasado, obtuvo ese 
brillante resultado mediante la aplicación de los métodos más avan- 
zados del análisis matemático de su tiempo. Sus trabajos originales 
sobre este tema se cuentan aún hoy entre los resultados más destaca- 
dos y, pasado ya un siglo, la demostración no ha sido lo suficientemente 
simplificada como para ser accesible a quienes no posean una buena 
preparación en la técnica del cálculo y de la teoría de funciones. 

Aunque no vamos a intentar probar el teorema de Dirichlet en 
toda su generalidad, es fácil generalizar la demostración de Euclides 
sobre la infinitud de la sucesión de números primos, para extenderla 
a algunas progresiones aritméticas especiales, tales como 4n + 3 y 
6n + 5. Para tratar la primera, observemos que todo número primo 
mayor que 2 es impar (ya que en otro caso sería divisible por 2) y, 
por tanto, será de la forma 4n + 1 ó 4n + 3, para ciertos enteros n. 
Por otra parte, el producto de dos números de la forma 4n + 1 es 
también de esta forma, ya que 


(4a + 1) (4d + 1) = 16ab + 4a + 4b + 1 = 4(4ab + a +») +1. 


Supongamos ahora que no existiera más que un número finito de nú- 
meros primos pı, Ps Ps »»» Pn, de la forma 4n + 3, y consideremos 
el número 


N = 4(pyPa3...Pn) — 1 = 4(P,.. + Pn— 1) + 3. 


O bien N es primo o puede ser descompuesto en producto de números 
primos, ninguno de los cuales puede ser p,, Pa, ..., Pn, puesto que divi- 
diendo N por cualquiera de éstos, da de resto —1. Además, no todos 
los factores de N pueden ser de la forma 4n + 1, ya que N no es de 
esta forma y, como acabamos de ver, el producto de números de la 
forma 4n + 1 es también de esta forma. Por tanto, al menos uno de 
dichos factores debe ser de la forma 4n + 3, lo cual es imposible, 
puesto que hemos visto que ninguno puede ser de los p y éstos for- 
maban, según nuestra hipótesis, todos los números primos de la forma 
4n + 3. En consecuencia, la hipótesis de que no hay más que un nú- 
mero finito de números primos de la forma 4n + 3 nos ha llevado a una 
contradicción, lo que demuestra que dicho número debe ser infinito. 


Ejercicio: Pruébese el correspondiente teorema para la progresión 6n +- 5. 


c) El teorema de los números primos.—En el proceso de la investi- 
gación en busca de una ley que gobernase la distribución de los nú- 
meros primos, se dió un paso decisivo cuando los matemáticos, dejando 
de lado los fútiles intentos para hallar una fórmula simple que diera 
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todos los números primos o el número exacto de éstos comprendidos 
entre los n primeros enteros, buscaron en su lugar información rela- 
tiva a la distribución media de los números primos dentro del con- 
junto de los enteros. 

Para todo entero n, designemos con An el número de primos com- 
prendidos entre los enteros 1, 2, 3, ..., n. Si subrayamos los números 
primos de la sucesión formada por los primeros enteros 1, 2, 3, 4, 5, 
6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, ... podremos calcular 
los valores iniciales de An: B B 


A = 0, Ap = 1, As = 4A4= 2, Aj = Å= 3, Ar = As = ÅA = Åp = 4, 
An = An = 5, An = Au = Ag = A = 6, An = An = 7, Ap = 8, ete 


Si tomamos ahora una sucesión de valores para n que crezca ili- 
mitadamente; p. ej., 
n = 10, 10%, 105, 104, ..., 


la correspondiente sucesión de valores de An, 


Aro, Ajos» Ajos, Ayo o., 


crecerá también sin límite (aunque menos rápidamente). Puesto que 
sabemos que existen infinitos números primos, los valores de Ay exce- 
derán más pronto o más tarde a cualquier número finito. La densidad 
de los números primos entre los n primeros enteros vendrá dada por 
el cociente An/n, y a partir de la tabla de números primos, los valo- 
res de Ap/n pueden ser calculados empíricamente para un gran nú- 
mero de valores de n. 


n An/n 





102 | 0,168 
10° | 0,078 498 
10* | 0,050 847 478 


rea ocooo... 


El último número decimal de esta tabla puede considerarse como la 
probabilidad para que un entero elegido al azar entre los 109 primeros 
enteros sea primo, ya que el número de casos posibles es 10%, de los 
cuales A,» son primos. 

La distribución de números primos particulares entre los enteros 
es muy irregular; pero esta irregularidad en pequeño desaparece si 
fijamos nuestra atención en la distribución media de los números pri- 
mos dada por la razón Ap/n. La ley sencilla que rige el comporta- 
miento de este cociente es uno de los más notables descubrimientos 
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de toda la matemática. Para establecer el teorema de los números pri- 
mos, debemos previamente definir el «logaritmo natural» de un entero 
n. Con este objeto, tomemos en el plano dos ejes perpendiculares y 
consideremos el conjunto de los puntos del plano para los cuales el 
producto de sus distancias x, y a estos dos ejes es igual a la unidad. 
En función de las coordenadas x, y, este lugar, una hipérbola equilá- 
tera, queda definido por la ecuación xy = 1. El log n vendrá definido 
entonces como el área limitada, en la figura 5, por la hipérbola, el 
eje x y las dos verticales x = 1 y x = n. (Una exposición más deta- 
llada del logaritmo se dará en el capítulo VIII.) Del estudio empírico 
de la tabla de números primos, Gauss dedujo que el cociente Ap/n es 
aproximadamente igual a 1/log n, y que la aproximación mejora al 
crecer n. La bondad de la aproximación viene medida por el cociente 

Ap/n 
1/log n 
dan en la tabla siguiente. 





; cuyos valores para n = 1000, 1 000 000, 1 000 000 000 se 











Anjin 
n An/n 1/log n Iogan 
10? | 0,168 0,145 1,159 
106 | 0,078 498 0,072 382 1,084 


10° | 0,050 847 478 | 0,048 254 942 | 1,053 


1 n 


FIG, 5.—El área rayada por debajo de la hipérbola define log n. 


Sobre la base de esta evidencia empírica, Gauss hizo la conjetura de 
que la razón Ap/n es «asintóticamente igual» a 1/log n. Lo que quiere 
decir que si tomamos una sucesión creciente de valores de n; p. ej., 
si tomamos para n 


10, 102, 103, 10%, ... 
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como antes hicimos, la razón de A,/n a 1/log n, 


Ap/n 

1/log n’ 
calculada para estos valores sucesivos de n, se aproximará cada vez 
más a 1, y que la diferencia entre dicho cociente y 1 será tan pequeña 
como queramos para valores suficientemente grandes de n. Esta afir- 
mación se expresa simbólicamente, mediante el signo —, en la forma: 
An 


1 
O ERE fi 
z log r lo que significa que 





n/n 
tiende a 1 al crecer n. 
1/log n 
Que ~ no puede ser reemplazado por el signo ordinario de igual- 
dad =, resulta evidente si se observa que mientras Ap es siempre 
entero, n/log n no lo es. 

El hecho de que el comportamiento medio de la distribución de 
los números primos pueda ser descrito mediante la función logarít- 
mica es un descubrimiento notable, ya que resulta sorprendente que 
dos conceptos matemáticos que parecen tan inconexos estén en reali- 
dad tan íntimamente ligados. 

Aunque el enunciado de la conjetura de Gauss es fácil de com- 
prender, una demostración rigurosa de dicha conjetura era inaccesible 
a los métodos de la ciencia matemática de su época. Para probar el 
teorema, que se refiere únicamente a conceptos elementales, es nece- 
sario emplear los métodos más potentes de la mátemática moderna. 
Fueron precisos casi cien años antes que el análisis se desarrollara lo 
suficiente para que Hadamard (1896), en París, y de la Vallée Pous- 
sin (1896), en Lovaina, pudieran dar una demostración completa del 
teorema de los números primos. Se han hecho simplificaciones y 
modificaciones importantes por v. Mangoldt y Landau. Mucho antes 
del resultado de Hadamard, Riemann (1826-1866) había contribuído 
al problema con una decisiva labor de exploración en un célebre tra- 
bajo, en el cual aparecen definidas las direcciones estratégicas del 
posible ataque. Recientemente, el matemático norteamericano Norbert 
Wiener ha sido capaz de modificar la demostración de modo que evita 
el uso de números complejos en un paso importante del razonamiento. 
En todo caso, la demostración del teorema de los números primos co- 
tinúa siendo una cuestión difícil, aun para estudiantes avanzados. Vol- 
veremos a ocuparnos del tema en el capítulo VIII, suplemento IV. ! 


1 En 1949 un joven matemático noruego, Selberg, y el matemático húngaro Erdós, 
en dos trabajos en cierto modo complementarios, dieron una demostración elemental (¡aun- 
que no sencilla!) del teorema de los números primos. La demostración, que no depende de 
ideas analíticas ajenas al problema, constituye un -descubrimiento de prim: impor- 
tancia Para la estructura lógica de la teoría de la distribución de los números primos, 
(N. del T. ` 
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d) Dos problemas no resueltos referentes a los números primos.— 
Mientras que el problema de la distribución media de los números 
primos ha sido resuelto satisfactoriamente, quedan otras varias con- 
jeturas que, sostenidas por la evidencia empírica, no han podido hasta 
ahora ser probadas como ciertas. 

Una de ellas es la famosa conjetura de Goldbach. Goldbach (1690- 
1764) aparece en la historia de las matemáticas únicamente por esa 
conjetura que propuso como problema en una carta a Euler en 1742. 
Comprobó que en todos los casos observados, todo número par (ex- 
cepto el 2, que es primo) puede ser representado como suma de dos 
números primos; p. ej.: 4 = 2 + 2, 6 = 3 + 3,8 = 5 + 3,10 = 5 + 5, 
12 = 5 +7,14 = 7 +7,16 = 13 + 3,18 = 11 + 7,20 =13+7,..., 
48 = 29 + 19, ..., 100 = 97 + 3, etcétera. 

= Goldbach preguntaba a Euler si era capaz de demostrar que esa 

propiedad es cierta para todo número par, o si podría encontrar un 
contraejemplo. Euler no pudo dar una respuesta, ni nadie ha podido 
darla hasta ahora. La evidencia empírica a favor de la proposición de 
que todo número par puede ser representado de ese modo es bastante 
convincente, como puede verificar cualquiera ensayando en algunos 
ejemplos. El origen de la dificultad reside en el hecho de que los nú- 
meros primos se definen mediante la multiplicación, mientras que el 
problema se refiere a la adición. En términos generales, resulta difí- 
cil establecer conexiones entre las propiedades aditivas y las multi- 
plicativas de los enteros. 

Hasta hace poco tiempo, una demostración de la conjetura de 
Goldbach parecía completamente inaccesible. Hoy, en cambio, no pa- 
rece estar muy lejos la solución de este problema. Un éxito importante, 
completamente inesperado y que sorprendió a los expertos, fué alcan- 
“zado en 1931 por un joven matemático ruso desconocido hasta enton- 
ces, Schnirelmann (1905-1938), quien probó que todo entero positivo 
puede ser representado como suma de a lo sumo 300 000 números primos. 
Aunque este resultado pueda parecer ridículo en comparación con el 
problema inicial de probar la conjetura de Goldbach, fué, sin embargo, 
el primer paso en la dirección justa. La prueba es directa y construc- 
tiva, aunque no da un método práctico para encontrar la descomposi- 
ción en suma de números primos para un entero arbitrario. Posterior- 
mente, el matemático ruso Vinogradoff, usando métodos debidos a 
Hardy, Littlewood y a su gran colaborador indio Ramanujan, ha 
conseguido reducir el número de 300 000 a 4, lo que está mucho más 
cerca de la solución del problema de Goldbach. Sin embargo, hay una 
diferencia notable entre los resultados de Schnirelmann y Vinogradoff, 
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más significativa aún que la diferencia entre 300 000 y 4. El teore- 
ma de Vinogradoff ha sido demostrado únicamente para enteros «su- 
ficientemente grandes» con más precisión: Vinogradoff ha probado 
que existe un entero N tal que todo entero n > N puede ser represen- 
tado como suma de, a lo más, cuatro números primos. La demostración 
de Vinogradoff no permite determinar N; en contraste con el teorema 
de Schnirelmann, el de Vinogradoff es esencialmente indirecto y no 
constructivo. Lo que realmente prueba Vinogradoff es que la hipótesis 
de que existen infinitos enteros que no pueden descomponerse en suma 
de 4 números primos es absurda. Aquí se tiene un buen ejemplo de 
la profunda diferencia existente entre los dos tipos de demostración, 
directa e indirecta. (Véase la discusión general en la página 95.) 

El problema siguiente, más notable aún que el de Goldbach, está 
todavía muy lejos de ser resuelto. Se ha observado que los números 
primos se suceden frecuentemente en pares de la forma p y p + 2. 
Así, p. ej., 3 y 5, 11 y 13, 29 y 31, etc. Se cree que la proposición que 
afirma la existencia de infinitos pares de ese tipo es cierta; sin em- 
bargo, hasta el presente no se ha podido dar el menor paso aprovecha- 
‘ble en el camino de demostrar tal proposición. 


II. CONGRUENCIAS 





1. Conceptos generales.—Siempre que se presenta la cuestión de 
la divisibilidad de enteros por un entero fijo d, el concepto y la nota- 
ción de congruencia (debidos a Gauss) sirven para aclarar y simplifi- 
car el razonamiento. 

Para introducir este concepto, consideremos los restos que dan los 
sucesivos enteros al dividirlos por 5; se tiene 
















0=0:5+0 7=1:'5+2 —1= —1.: 
1=0:5+1 8=1:5+3 -2 = —1. 
2=0:5+2 9=1-5+4 3231: 
3=0:5+3|10=2:5+0 —4=-—1: 
4=0:54+4 |11=2:-5+1 -5=-1: 
5=1:5+0]/12=2-5+2 =-6=-2: 
6=1-5+1 | ete etc. 








Observamos que el resto de cualquier entero es uno de los números 
0, 1, 2, 3, 4. Diremos que dos enteros a y b son «congruentes módu- 
lo 5» si ambos dan el mismo resto al ser divididos por 5. Así, 2, 7, 12 
17, 22, ..., —3, —8, —13, —18, ..., son todos congruentes módulo 5, 
puesto que todos dan de resto 2. En general, diremos que dos enteros 
a y b son congruentes módulo d, siendo d un entero dado, si a y b dan 
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el mismo resto al dividirlos por d, lo que equivale a decir que hay 
un entero n tal que a — b = nd; p. ej., 27 y 15 son congruentes mó- 
dulo 4, puesto que 


27=6-: 4 +3, 15=3:-4+3. 


El concepto de congruencia es tan útil, que resulta conveniente 
disponer de una notación sencilla para él. Escribiremos 


a=b (mód d) 


para expresar que a y b son congruentes módulo d. En los casos en 
que no haya duda acerca de cuál sea el módulo, el «mód d» de la fór- 
mula puede ser omitido. [Si a no es congruente con b módulo d, escri- 
biremos a Æ b (mód d).] 

Las congruencias aparecen frecuentemente en la vida diaria; p. ej., 
las manecillas de un reloj indican la hora módulo 12, y el cuentaki- 
lómetros de un coche da el total de kilómetros recorridos módulo 
100 000. 

Antes de proceder a una discusión. detallada de las congruencias, 
el lector debe observar las siguientes proposiciones, que son todas ellas 
equivalentes: 

1. aes congruente con b módulo d. 


2. a=b + nd para un cierto entero n. 
3. d divide a a — b. 


La utilidad de la notación de Gauss para las congruencias se basa en 
el hecho de que la congruencia respecto de un módulo fijo tiene varias 
de las propiedades formales de la igualdad ordinaria. Las propiedades 
formales más importantes de la relación a = b son las siguientes: 

1) Se tiene siempre a = a. 

2) De a = b se sigue b = a 

3) De a=b y b =c se sigue a = c. 


Además, de a = a' y b = b’ se sigue 


4) a+b=a 4b 
5) a—b =a — b. 
6) ab=a%. 


Estas propiedades continúan siendo válidas si se reemplaza la rela- 
ción a = b por la de congruencia a = b (mód d). Así: 


1”) Se tiene siempre a = a (mód d). 
2°) De a= b (mód d) se sigue b = a (mód d). 
3) De a= b (mód d) y b = c (mód d) se sigue a = c¢ (mód d). 


Dejamos al cuidado del lector el comprobar estos hechos. 
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Además, de a = a* (mód d) y b=b" (mód d) se sigue 


4%) a+b=a' + b’ (mód d). 
5%) a—b=a'"-— b’ (mód d). 
6’) ab = a'b’ (mód d). 


Resulta, en consecuencia, que varias congruencias respecto del mismo 
módulo pueden sumarse, restarse y multiplicarse. Para probar estas tres 
proposiciones es suficiente observar que si 


a =a + rd, b = b’ + sd, 
se tiene 
a+b=a +b + (r + sd, 
a —b =a — b’ + (r — sk, 
ab = a'b’ + (a's + Dr + rsd)d, 


de donde resultan las conclusiones deseadas. 

El concepto de congruencia tiene una interpretación geométrica 
muy intuitiva. De ordinario, cuando se quieren representar los en- 
teros geométricamente, se elige un segmento de longitud unidad y se 


— _  A—_—MMMMMMMM——_O QCA A A —ÉÁ 
-3 -2 -l 0 1 2 3 


FiG. 6.—Representación geométrica de los números enteros. 


llevan éste y sus múltiplos en los dos sentidos. De este modo se hace 
corresponder a cada entero un punto sobre la recta, como en la fi- 
gura 6. Si se trata de los enteros módulo d, dos números congruentes 
se consideran como uno mismo en lo que a la división por d se refiere, 
puesto que los dos dan el mismo resto. Para ver esto geométricamente, 
utilicemos una circunferencia dividida en d partes iguales. Cualquier 
entero dividido por d da de resto uno de los d números 0, 1, ..., d — 1, 
que están situados a intervalos iguales sobre la circunferencia. Cual- 
quier entero es congruente módulo d con uno de estos d números, y, 
por tanto, puede ser representado geométricamente por uno de esos 
puntos; dos números son congruentes si están representados por el 
mismo punto. La figura 7 está dibujada para el caso d = 6. La esfera 
de un reloj es otro ejemplo tomado de la vida corriente. 

Como aplicación de la propiedad multiplicativa 6') de las con- 
gruencias, determinaremos los restos de las sucesivas potencias de 10 
respecto de un número dado; p. ej., 


10 == — 1 (mód. 11), 
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-2 P 
4 
10 1 


e. min». 


Flia. 7.—Representación geométrica de los números enteros respecto al módulo 6. 


ya que 10 = —1 +:11. Por mulktiplicaciones sucesivas de esta con- 
grueñcia por sí misma 'se obtiene 


103 = (-— 1) (- 1) =1 (mód 11), 
101 = — 1 » 
104 = 1 » , ete. 


Como consecuencia, se puede probar que cualquier entero 
:=04% +4: 10+a,:101+...+4.: 10, 


expresado en el sistema decimal, da al dividirlo por 11 el mismo 
resto que la suma de sus cifras, tomadas alternativamente con los 
signos:más y menos, 


t = dag — a, +4 — a+... 


En efecto, se puede escribir 
z — t =a, : 11 + a (10? — 1) + ax(10? + 1) + a10 — 1) + +: 


Y como todos los números 11, 102? — 1, 10% + 1, ... son congruentes 
con 0 módulo 11, también lo será z — tł; por consiguiente, z da el mismo 
resto que i al dividirlo por 11. Resulta en particular que un número 
es divisible por 11 (es decir, da de resto 0) cuando, y únicamente en- 
tonces, la suma alternada de sus cifras es divisible por 11. Por ejem- 
plo, puesto que 3 — 1 + 6 — 2 + 8 — 1 + 9 = 22, el número z = 
= 3 162 819 es divisible por 11. Encontrar una regla de divisibilidad 
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por 3 ó por 9 es más sencillo aún, puesto que 10 = 1 (mód 3 ó 9), y, 
por consiguiente, 102 = 1 (mód 3 ó 9) para todo n. Resulta así que 
para que un número z sea divisible por 3 ó por 9 es necesario y sufi- 
ciente que la suma de sus cifras 
s= a + a +4 +... +a 

sea también divisible por 3 ó por 9, respectivamente. 

Para las congruencias módulo 7 se tiene 

10=3, 10=2, 1=-—1, 1%=-3, 10=-2, 1%=1. 


Los restos sucesivos se repiten, de donde resulta que para que z sea 
divisible por 7 es necesario y suficiente que la expresión 
r = a, + 3a, + 2a, — a, — 3a, — 2a; + a, + 34 +... 
sea divisible por 7. 
Ejercicio: Hállese una regla análoga para la divisibilidad por 13. 


Sumando o multiplicando congruencias respecto de un módulo fijo, 
p. ej., d = 5, podemos evitar los números muy grandes al reemplazar 
cualquier número a por el del conjunto. 


0, 1, 2, 3, 4 


congruente con él. Así, para ealcular sumas y productos módulo 5 
necesitamos únicamente las siguientes tablas de adición y multipli- 
cación: 

a:b 


> 
Il 

© 
pa 


»bBunN=o| o 
OBUuN= 
-Os*un]|No 
N-=Oox4a0|w 
VN=oOoa»a]| e 
ooooo 

A YN -=oOo 
Vreanoj]|n 
Náamuooj ús 
-vouoao]| a 


De la segunda de esas tablas resulta que un producto ab es congruen- 
te con O (mód 5) únicamente si a o b son = 0 (mód 5). Esto sugiere 
la ley general 


7) ab=0 (mód d) únicamente si a = 0 ó b = 0 (mód d), 
la cual resultaría como una extensión de la ley ordinaria para enteros 
que dice que se tiene ab = 0 únicamente si es a = 0 ó b = 0. Ahora 


bien: la ley 7) es válida solamente cuando el módulo d es un número 
primo. En efecto, la congruencia 


ab=0 (mód d) 
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significa que d divide a ab, y hemos visto antes que un número primo 
divide a un producto ab únicamente si divide a a o a b; esto es, úni- 
camente si 

a=0 (módd) ó b=0 (mód d) 


Si d no es primo, esta regla no vale en general; puesto que si es 
d =r: s, siendo r y s menores que d, se tiene 


rÆ0 (mód d) s%0 (mód a), 


y, en cambio, es 
rs=d=0 (mód d). 


Por ejemplo, 2 Æ 0 (mód 6) y 3 Æ 0 (mód 6); sin embargo, 2 : 3 = 
= 6 =0 (mód 6). 


Ejercicio: Pruébese que la siguiente regla de simplificación es válida. para 
congruencias respecto de un módulo primo: 


Si es ab = ac y a Æ 0, se tiene b = c. 


Ejercicios: 

1. ¿Con qué número entre 0 y` 6 inclusive es congruente módulo 7 el pro- 
ducto 11-18-2322-13-19? 

2. ¿Con qué número comprendido entre 0 y 12 inclusive es congruente mó- 
dulo 13 el producto 3-7-11-17-19-23-29-113? 

3. ¿Con qué número entre 0 y 4 inclusive es congruente módulo 5 la suma 
1+2 +2:+... + 29 


2. Teorema de Fermat.—En el siglo xvi, Fermat, el fundador de 
la moderna teoría de números, descubrió un teorema muy importante: 
Si p es un número primo que no divide al entero a, se tiene: 


œ-i=1 (mód p), 


lo. que significa que la potencia (p — 1)-ésima de a da resto 1 al di- 
vidirla por p. 

Algunos de nuestros: cálculos anteriores confirman este teorema; 
p. ej., encontrábamos que 10* = 1 (mód 7), 10? = 1 (mód 3), y 101=1 
(mód 11). Del mismo modo se vería que es 21? = 1 (mód 13) y 5=1 
(mód 11). Para comprobar las últimas congruencias no es.necesario 
calcular efectivamente las potencias indicadas, ya que pueden utilizarse 
ventajosamente las propiedades multiplicativas de aquéllas: 


24 =16=3 (mód 13) 5% =3 (mód 11) 
22 =9=-4 » 5 = 9 = —2 ; » 
22=-4:3=-—12=1 » 58 =4 » 


50=3-4=12=1 > 
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Para demostrar el teorema de Fermat, consideremos los múlti- 
plos de a: 


m, = a, m, = 2a, mM, = 34,..., Mp1 = (p — 1)a 


Ningún par de estos enteros puede estar formado por números 
congruentes módulo p; de lo contrario, p sería un factor de Mr — m= 
= (r — sja para algún par r, s, siendo 1:< s < r < (p — 1). Pero la 
regla 7) indica que esto no puede ocurrir; puesto que r — s es menor 
que p, p no puede ser factor de (r — s), y habiamos supuesto que p 
no dividía a a. Asimismo, ninguno de aquellos múltiplos puede ser 
congruente con 0. Por consiguiente, los números M,, My, My ..., Mp-i 
deben ser congruentes con los números 1, 2, 3, ..., p — 1 tomados en 
orden conveniente. Resulta como consecuencia 


MM Mp, =1 +2: 3: **(p— 1j- =1:2-3:-:-(p— 1) (mód p), 
o, si escribimos por brevedad K en vez de 1 + 2-3... (p — 1), 
K(a?-! — 1)= 0 (mód p). 


Pero K no es divisible por p, ya que no lo es ninguno de sus factores; 
por tanto, en virtud de la regla 7), (aP-* — 1) debe ser divisible por p; 
es decir, 

art — 1 =0 (mód p), 


que es el teorema de Fermat. 

Para comprobar el teorema una vez más, tomemos p = 23 y a = 5. 
Se tiene entonces (mód 23) 52 = 2, 5* == 4, 5% = 16 = —7, 5" = 49 = 
= 3, 5" = 12, 59 = 24 = 1. Con a = 4, en vez de 5, se obtendría, 
también (mód 23), 4:= —7, £ = —28 = —5, 4 = —20 = 3, 
48 = 9, 48 = —45 = 1, 42 = 1. 

En el ejemplo anterior con a = 4, p = 23, y en otros, se observa 
que no solamente la potencia (p — 1)-ésima de a, sino también otras 
potencias menores pueden ser congruentes con 1. Pero ocurre siem- 
pre que la menor de dichas potencias, en dicho caso 11, es un divi- 
sor de p — 1. (Véase el ejercicio 3 siguiente.) 


Ejercicios: 
1. Compruébese mediante cálculos análogos a los anteriores que 2% = 1 
(mód 17); 38 = —1 (mód 17); 31! = —1 (mód 29); 21! = —1 (mód 29); 41 = 1 


(mód 29); 51! = 1 (mód 29). 

2. Compruébese el teorema de Fermat para p = 5, 7, 11, 17 y 23, con dife- 
rentes valores de a. 

3. Demuéstrese el teorema general siguiente: El menor entero positivo e para 
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el que se tenga a° == 1 (mód p), siendo p primo, debe ser un divisor de p — 1 [/n- 
dicación: Dividiendo p — 1 por e, se obtendría 


P=1=ke+r, 


siendo 0 < r < e; utilícese el hecho de que aP-! = a? = 1 (mód p).] 


3. Restos cuadráticos.—Por los ejemplos considerados en rela- 
ción con el teorema de Fermat, se ha visto que no solamente es siem- 
pre aP-1= 1 (mód p), sino que (si p es un número primo distinto 
de 2, y, por consiguiente, impar y de la forma p = 2p’ + 1) para 
algunos valores de a, aP’ = alP-D/2 = 1 (mód p). Este hecho sugiere 
otras varias cuestiones interesantes. Podemos escribir el teorema en 
la. siguiente forma: 


api — 1 = a — 1 = (a™' — 1) (a +1)=0 (mód p). 


Puesto que un producto es divisible por p cuando uno al menos 
.de los factores lo: es, resulta inmediatamente que, bien a” — 1 o 
ab" + 1 debe ser divisible por p, de' modo que para cualquier primo 
p > 2 y cualquier número a no divisible por p, se tiene 


:alo-D/ = 1 o l . a0- = —1 (mód p). 


Desde el comienzo de la moderna teoría de números los matemá- 
ticos se han interesado por el problema de determinar qué números a 
pertenecen a la primera clase y cuáles a la segunda. Supongamos que 
a es congruente módulo p con el cuadrado de otro entero z, 


a=x* (mód p). 


Entonces se tendrá: alb-D/2= xp-1 y, de acuerdo con el teorema 
de Fermat, congruente con 1 módulo p. Un número a, no múltiplo de 
p. que sea congruente módulo p: con el cuadrado de otro entero se 
llama resto cuadrático de p, mientras que un número b, no múltiplo 
de p, que no sea congruente con ningún cuadrado, se llama no-resto 
cuadrático de p. Acabamos de ver que todo resto cuadrático a de p 
satisface la congruencia a(P-)/2 = 1 (mód p). Sin grandes dificultades 
se puede probar que para cualquier no-resto b se tiene la congruencia 
blo-0/2 = —1 (mód p). Por otra parte, vamos a demostrar que entre 
los números 1,.2, 3, ..., p — 1 hay precisamente (p — 1)/2 restos cua- 
dráticos y (p — 1)/2 no-restos. 

Aun siendo posible obtener muchos datos empíricos por cálculo 
directo, al comienzo no fué fácil descubrir leyes generales que rigie- 
ran la distribución de los restos y no-restos cuadráticos. La primera 
propiedad importante de los restos fué observada por Legendre (1752- 
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1833), y designada más tarde por Gauss con el nombre de ley de reci- 
procidad cuadrática. Esta ley se refiere al comportamiento de dos nú- 
meros primos distintos p y q, y dice que q es un resto cuadrático de p 
cuando, y sólo entonces, p es resto cuadrático de q, si el producto 
[(p — 19/21 [(q — 1)/2] es par. En el caso en que dicho producto sea 
impar, la situación es la inversa, de modo que p es resto de q si q es 
no-resto de p. Uno de los descubrimientos juveniles de Gauss fué la 
primera demostración rigurosa de este teorema, que durante mucho 
tiempo había desafiado al mundo matemático. La primera demostra- 
ción de Gauss no era sencilla, y aún hoy la ley de reciprocidad no es 
fácil de establecer, a pesar de que se han dado de ella numerosas 
demostraciones. Su verdadera significación aparece claramente cuan- 
do se establece su conexión con los descubrimientos modernos en la 
teoría de los números algebraicos. 

Como ejemplo para ilustrar la distribución de los restos cuadráti- 
cos, tomemos p = 7. Entonces, puesto que se tiene 


03=0, 1=1, 21=4, 3=2, 4i=2, 5=4, 6=1, 


todas módulo 7, y ya que los cuadrados restantes repiten esta suce- 
sión, los restos cuadráticos de 7 son los números congruentes con 1, 2 
ó 4, mientras que los no-restos son congruentes con 3, 5 ó 6. En el 
caso general, los restos cuadráticos de p son los números congruentes 
con 13, 2%, ..., (p — 1)*. Pero éstos son congruentes a pares, pues se tiene 


xi=(p—x)? (mód p) [p. ej., 2? = 5? (mód 7), 


por ser (p — 2)* = p? — 2px + qr? = qx? (mód p). Resulta así que la 
mitad de los números 1, 2, ..., p — 1 son restos cuadráticos de p y la 
otra mitad son no-restos cuadráticos. 

Como ejemplo de la ley de reciprocidad tomemos p = 5, q = 11. 
Por ser 11 =1* (mód 5), 11 es resto cuadrático (mód 5); y como el 
producto [(5 — 1)/2][(11 — 1)/2] es par, la ley de reciprocidad dice 
que 5 es resto cuadrático (mód 11). En confirmación de esto, observe- 
mos que se tiene 5 = 4* (mód 11). Por otra parte, si p = 7, q = 11, 
el producto [(7 — 1)/2] [((11 — 1)/2] es impar, y en efecto 11 es un 
resto cuadrático (mód 7) [ya que 11 = 2? (mód 7)], mientras que 7 es 
no-resto cuadrático (mód 11). 


Ejercicios: 

1. 62 = 36 = 13 (mód 23). ¿Es 23 resto cuadrático (mód 13)? 

2. Hemos visto que z? = (p — r) (mód p). Demuéstrese que ésas son tas 
únicas congruencias módulo p entre los números 12, 23, 33, ..., (p — 1). 
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OI. LOS NÚMEROS PITAGÓRICOS Y EL ÚLTIMO TEOREMA 
DE FERMAT 


Una interesante cuestión de la teoría de números se halla relacio- 
nada con el teorema de Pitágoras. Los griegos sabían que un triángulo 
con lados 3, 4, 5 es un triángulo rectángulo. Se presentaba entonces la 
cuestión general: «¿Qué otros triángulos rectángulos tienen sus lados 
iguales a múltiplos enteros de la unidad de longitud?» El teorema de 
Pitágoras se expresa algébricamente por la ecuación 


ete, [1] 


donde a y b son las longitudes de los catetos, y c, la de la hipotenusa. 
El problema de hallar todos los triángulos rectángulos con lados de 
longitud entera es equivalente al de hallar las soluciones enteras de. 
la ecuación [1]. Una terna de dichos números se llama terna de núme- 
ros pitagóricos. 

El problema de hallar todas las ternas de números pitagóricos 
puede resolverse fácilmente. Si a, b y c forman una terna pitagórica, 
de modo que a? + b? = c?, pongamos para simplificar a/c = x, b/[c=y, 
donde x e y son números racionales para los cuales se verifica x! + 
+ y? =1. Entonces se tiene y? = (1 — x) (1 + x), o lo que es lo 
mismo y/(1 + x) = (1 — 2)/y. El valor común de los dos miembros 
de esta ecuación es un número t que puede expresarse como cociente 
de dos números enteros ujv. Podemos escribir entonces: y = t(1 + x) 
y (1 — x) = (y; es decir, 


tr=y=-—!, +dly=1. 
De este sistema de ecuaciones se deduce inmediatamente 


1-8 2 


terpe VE 


y sustituyendo zx, y, t por sus valores, se tiene 








a p? — ut b 2uv 
c Bpo co ph 
Por consiguiente, 
a = (v? — u)r, 
b = (2uvyr, [2] 


c = (ul + ud, 


con un factor arbitrario de proporcionalidad r. Esto prueba que si 
(a, b, c) es una terna pitagórica, a, b, c son proporcionales a v? — u?, 
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2uv, u? + v?, respectivamente. Recíprocamente, es fácil ver que toda 
terna (a, b, c) definida mediante [2] es pitagórica, ya que de [2] se sigue 


= (ut — 2ulot + ptr, 
= (4uto3)rs, 
= (ul + 2utot + vira, 


de forma que a? + b? = cè. 

El resultado anterior puede simplificarse aún: a partir de cualquier 
terna pitagórica (a, b, c) se pueden obtener otras ternas pitagóricas 
(sa, sb, sc) para todo valor entero de s; así, de (3, 4, 5) se obtienen las 
(6, 8, 10), (9, 12, 15), etc. Tales ternas no son esencialmente distintas, 
ya que corresponden a triángulos rectángulos semejantes. Definiremos 
como primitiva una terna pitagórica cuando los números a, b y c no 
tengan ningún factor común. Se puede probar que las fórmulas 


v — ud, 
2w, 
ul + os, 


a 
b 
e 


Una 


dan para todo par de enteros positivos u, v, con u > v, y tales que u y v 
no tengan factores comunes ni sean los dos impares, todas las ternas 
primitivas de números pitagóricos. 


*Ejercicio: Demuéstrese la última proposición. 


Como ejemplos de ternas primitivas de números pitagóricos se 
tiene: u = 2, v = 1: (3, 4, 5) u = 3, v = 2: (5, 12, 13) u = 4, v = 3: 
(7, 24, 25); ...; u = 10, v = 7: (51, 140; 149); etc. 

Los resultados alcanzados para los números pitagóricos inducen de 
modo natural a plantear la cuestión de obtener enteros a, b, c para 
los que se verifique a? + b? = c? o at + bt = ct, o, en general, para 
un exponente entero positivo n > 2 dado, a determinar las soluciones 
enteras y positivas de la ecuación 


a+b =e, 13] 


Fermat dió a esta cuestión una respuesta de modo un poco espectacu- 
lar. Estudiando la obra de Diofanto, el que más había contribuído 
entre los antiguos a la teoría de números, Fermat tenía la costumbre 
de escribir comentarios en las márgenes del libro. De esta forma 
enunció sin demostración muchos teoremas. Todos han sido probados 
posteriormente, con excepción de uno de ellos de especial importancia. 
Comentando la teoría de los números pitagóricos, Fermat escribió que 
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la ecuación [3] no admite soluciones enteras para cualquier n > 2, pero 
que la elegante demostración que había encontrado era desgraciada- 
mente demasiado larga para el margen de que disponía. 

De esta proposición general no han podido ser demostradas ni su 
validez ni su falsedad a pesar de los esfuerzos de muchos de los más 
grandes matemáticos posteriores a Fermat. El teorema ha sido pro- 
bado para varios valores de n; en particular para todo n < 619, pero 
no para todo n, sin haberse encontrado hasta el presente ningún con- 
traejemplo. Aunque el teorema en sí no es de gran importancia mate- 
mática, las tentativas hechas para demostrarlo han dado- lugar a im- 
portantes investigaciones en la teoría de números. Este problema ha 
despertado también gran interés en círculos no matemáticos, debido 
en parte a un premio de 100.000 marcos ofrecido a la primera persona 
que diera una solución aceptada por la Real Academia de Gotinga. 
Hasta que la' inflación que siguió en Alemania a la primera guerra 
mundial quitó todo valor económico a dicho premio, gran número de 
«soluciones» incorrectas eran enviadas todos los años a la Academia. 
Incluso matemáticos serios han creído a veces haber encontrado e 
incluso han publicado soluciones «correctas»; sin embargo, hasta el 
presente en todas ellas ha sido descubierto algún error. Con la deva- 
luación del marco, el interés general parece haber desaparecido, aun- 
que de cuando en cuando la prensa anuncia que el problema ha sido 
resuelto por un genio hasta entonces desconocido. 


IV. EL ALGORITMO DE EUCLIDES 


1. Teoría general.—Es bien: conocida la regla de división de un 
entero a por otro b, y el lector sabe que el proceso de división no ter- 
mina hasta que se llega a un resto más pequeño que el divisor. Así, si 
a = 648 y b = 7 se obtiene un cociente q = 92 y un resto r = 4. 


648| -7 
63 |92 648 = 7 - 92 + 4. 
|? 

14 


4 


Lo que se puede enunciar como un teorema general: Si a es un 
entero cualquiera y b es un entero mayor que 0, se pueden encontrar 
siempre dos enteros q y r tales que 


a=b-q+r, 11] 
0O<r<b. 
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Para probar esta proposición sín utilizar la regla ordinaria de división de 
enteros, basta observar que cualquier entero a es o bien múltiplo de b, 


a= bq, 
o está comprendido entre dos múltiplos consecutivos de b, 
bg < a< blq +1)= bg +b. 
En el primer caso se tiene (1] con r = 0, y en el segundo resulta, de la primera 
desigualdad anterior, 
a—bļ=r >Q, 


mientras que la segunda desigualdad da 
a=bq=r<b, 
de modo que resulta 0 < r < b, como se dice en [1]. 


De este sencillo hecho se deduce una gran variedad de consecuen- 
cias importantes; la primera de ellas es un método para hallar el 
máximo común divisor de dos enteros. 

Sean a y b dos enteros cualesquiera, ninguno de los cuales sea 0, 
y consideremos el conjunto de todos los enteros positivos que divi- 
den simultáneamente a a y b. Este conjunto es evidentemente finito, 
puesto que si, p. ej., es a 40, ningún entero mayor que a puede ser 
divisor de a. En consecuencia, no puede haber más que un, número 
finito de divisores comunes a a y b, y entre ellos habrá uno mayor 
que todos, d. Este número entero d se llama máximo común divisor 
de a y b, y se escribe d = (a, b). Así, para a = 8 y b = 12 se obtiene 
por ensayos directos (8, 12) = 4, mientras que para a=5yb=9 
resulta (5, 9) = 1. Si a y b son números grandes, p. ej., a = 1804 y 

= 328, el método de ensayos sería muy laborioso € incierto. Un 
método breve y seguro lo da el llamado algoritmo de Euclides. (Un 
algoritmo es un método sistemático de cálculo.) Está basado en el 
hecho de que de toda relación de la forma 


a=b-*q+r (2) 
se sigue 
(a, b) = (b, F), (3] 


puesto que todo número u que divida a a y b 
a = su, b = lu, 


divide también a r, ya que es r = a — bq = su — qtu = (s — qt)u; 
y recíprocamente, todo número v que divide a b y r, 


, 


b = sv, r= {v 
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divide también a a, ya que es a = bq + r = s'vq + tv = (sq + to. 
Por consiguiente, todo divisor común de a y b es también divisor 
común de b y r, y recíprocamente. Por tanto, siendo el conjunto de 
todos los divisores comunes a a y b idéntico con el conjunto de todos los 
divisores comunes a b y r, el mayor de los divisores comunes a a y b debe 
ser igual al mayor de los divisores comunes a b y r, lo que demues- 
tra [3]. Veremos inmediatamente la utilidad de esta relación. 

Volvamos a la cuestión de hallar el máximo común divisor de 
1804 y 328. Por división entera obtenemos 


1804 | 328 
1640 |5 


164 





de donde resulta 
1804 = 5 - 328 + 164. 


De aquí se sigue, en virtud de [3], 
(1804, 328) = (328, 164). 


Se observa que el problema de hallar (1804, 328) ha sido reducido a 
otro análogo que se refiere a números más pequeños. Continuemos 
el proceso; de 


328 | 164 
328 |7 
0 ` 


resulta 328 = 2 * 164 + 0, de modo que (328, 164) = (164, 0) = 164. 
En consecuencia, (1804, 328) = (328, 164) = (164, 0) = 164, que es el 
resultado buscado. 

Este proceso para hallar el máximo común divisor de dos núme- 
ros está expuesto en forma geométrica en los Elementos de Euclides. 
Para enteros arbitrarios a y b, no simultáneamente nulos, dicho pro- 
ceso puede ser descrito aritméticamente en los términos siguientes. 

Podemos suponer b Æ 0, puesto que (a, 0) = a. Entonces, por di- 
visiones sucesivas escribiremos: 


a=b +r (0 < r, <b) 
b =r + Fe (0 < <T) 
n = Ta + fs (0 < Ty < r) 14] 


3 = Pga H Ta (0 < ra < 53) 
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mientras los restos f,, Ta Fa, ... SON distintos de 0. De las desigualdades 
que aparecen a la derecha en ı [4] resulta que los restos sucesivos for- 
man una sucesión decreciente de números positivos: 


b>r>n>1>>:':>0, [5] 


Por tanto, a lo sumo al cabo de b divisiones (bastante menos, ya que 
la diferencia entre dos restos sucesivos es en general mayor que 1), 
se debe llegar al resto 0: 


Pn-2 = Fa-y9n + fa 
Pa-1 = lafn: + 0. 


Cuando esto ocurre, sabemos que es 


(a, db =P; 


en otros términos, (a, b) es igual al último resto mayor que 0 en la suce- 
sión [5]. Esto se deduce de la aplicación sucesiva de la igualdad. [3] 
a las ecuaciones [4], puesto que de las igualdades de [4] resulta 


a, b= nah r= orh o ta) = Ca ra) 
Fa Ta) == (fis Ta); +2 + a (Pap) En) = (fas 0) = ros 


Ejercicio: Aplíquese el algoritmo de Euclides para hallar él máximo común di- 
visor de: a) 187, 77; - b) 105,385; c) 245, 193. 


A partir de las ecuaciones [4] puede obtenerse una importante 
propiedad de (a, b). Si es d = (a,b), existen dos enteros, positivos o 
negativos, k y 1 tales que 


d = ka + ib. [6) 


Para probarlo, consideremos la sucesión [5] de restos. De la primera 
ecuación en [4] resulta 


1 =a — hb, 


: de modo que r, puede escribirse en la forma ka + hb (en este caso 
k = 1, h= —4qy. De la ecuación siguiente en [4] se obtiene 


r, = b — gr, = b > galiza + hb) = (—qaleja + (l — qu)o = ka + hb. 


Evidentemente, este proceso puede repetirse para los restos sucesivos 
Fa» Fa «+. hasta llegar a una relación 


Fa = ka + bb, 


como queríamos probar, 
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Como ejemplo, consideremos el algoritmo de Euclides para hallar 
(61, 24); el máximo común divisor es 1, y la representación deseada 
para 1 puede calcularse a partir de las ecuaciones 


61 =2- 24 + 13; 24 =1-+ 13 + 11; 13=1-+-11 +2; 
11=5:2+1: 2=2:1+0, 


De la primera de estas ecuaciones obtenemos 


13 = 61 — 2- 24; 
de la segunda, 


11 = 24 — 13 = 24 — (61 — 2-24) = — 6l + 3- 24; 
de la tercera, 
2 = 13 — 11 = (61 — 2- 24)—(— 61 +3: 24) = 2 - 61 — 5- 24, 
y de la cuarta, 


1 =11 — 5:2 = (— 61 +3. 24)- 5(2- 61 — 5: 24) = — 11 + 61 + 28 - 24. 


2. Aplicación al teorema fundamental de la aritmética.—El hecho 
de que d = (a, b) pueda escribirse siempre en la forma d = ka + lb 
puede utilizarse para dar una demostración del teorema fundamen- 
tal de la aritmética, independiente de la dada en la página 30. Primero 
probaremos, como lema, el corolario de la página 31, y luego, a par- 
tir de este lema, deduciremos el teorema fundamental, invirtiendo así 
el orden de la demostración anterior. 

Lema: Si un número primo p divide a un producto ab, divide a uno 
de los factores a, b. 

Si p no divide a a, por ser primo p, se debe tener (a, p) = 1, ya 
que los únicos divisores de p son p y 1. Por consiguiente, se podrán 
encontrar dos enteros k y l tales que 


1 = ka + Ip. 
Multiplicando los dos miembros de esta igualdad por b, se obtiene 
b = kab + ipb. 
Ahora bien: si p divide a ab, se puede escribir 


ab = pr 
de modo que 
= kpr + ipb = p(kr + lb), 
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de donde resulta evidente que p divide a b. Hemos demostrado así 
que si p divide a ab y no divide a a, debe dividir a b; por consiguiente, 
en todo caso p dividirá a a o a b si divide a ab. 

La extensión de este resultado a productos de más de dos facto- 
res es inmediata; p. ej., si p divide a abc, aplicando dos veces el lema 
podemos demostrar que p debe dividir al menos.a uno de los enteros 
a, bo c. Ya que si p no divide ni a a, nia b, ni a c, no puede dividir 
a ab y, en consecuencia, tampoco puede dividir a (ab)c = abc. 


Ejercicio: La extensión de este razonamiento a productos de cualquier núme- 
ro n de enteros requiere el uso tácito o expreso del principio de inducción mate- 
mática. Complétense los detalles de tal razonamiento. 


Del resultado anterior se sigue de modo inmediato el teorema fun- 
damental de la aritmética. Supongamos que se tienen dos descompo- 
siciones de un entero N en producto de números primos: 


N = PiPa-- Pr = Qa- - -qs + 


Puesto que p, divide al segundo miembro de estas igualdades, debe 
dividir también al tercero, y, por tanto, por el ejercicio anterior, debe 
dividir a uno de los factores qx. Pero qx es primo; por consiguiente, 
p, debe ser igual a qx. Suprimiendo este factor común en los dos últi- 
mos miembros, resultará que p, debe dividir a uno de los q, restantes, 
y en consecuencia ser igual a él. Suprimiendo p, y q, procederíamos 
análogamente con p, ..., Pr. Al final de este proceso se habrán supri- 
mido todas las p, dejando solamente la unidad en el segundo miem- 
bro. En el último miembro no podrá quedar ninguna q, puesto que 
todas las q son mayores que uno. Por consiguiente, las p y las q apa- 
recen en parejas de números iguales, lo que prueba que, salvo quizá 
el orden de los factores, las dos descomposiciones son idénticas. 





3. La función ọ de Euler. De nuevo el teoremia de Fermat.—Dos 
enteros a y b se llaman primos relativos cuando su máximo común 
divisor es 1: 

l (a, b) = 1. 


Por ej., 24 y 35 son primos relativos, mientras que 12 y 18 no lo son. 
Si a y b son primos relativos, existen dos enteros positivos o negativos 
k y 1 tales que 

ka + lb = 1. 


Esto se sigue de la propiedad de (a, b) establecida en la página 53. 


56 TEORÍA DE NÚMEROS.—SUPL. [cap. 1 





Ejercicio: Demuéstrese el teorema siguiente: Si un entero r divide a un pro- 
ducto ab y es primo relativo con a, r divide a b. (Indicación: si r es primo relativo 
con a, existen dos enteros k y l tales que 


kr + la =1. 


Multiplíquense los dos miembros de esta igualdad por b.) Este teorema incluye 
como caso particular el lema de la página 54, ya que un número primo p es primo 
relativo con un entero a cuando, y solamente entonces, p no divide a a. 


Para todo entero positivo n, designemos con g(n) el número de 
enteros primos con n y menores que n. Esta función, introducida por 
Euler, es una función de gran importancia.en teoría de números. Los 
valores de p(n) para los primeros valores de n pueden calcularse 
fácilmente: 


p(1) = 1 puesto que 1 es primo relativo con 1, 

p(2) = 1 » 1 » » con 2, 

p(3) = 2 + 1 y 2 son primos relativos con 3, 

p(4) = 2 , 1y3 > » con 4, 

p(5) = 4 » 1, 2,3,4 >œ ' con 5, 

(6) = 2 » 1,5 » » con 6, 

e) =$ + 1, 2, 3, 4, 5, 6 son primos relativos con 7, 
p(8) = 4 » 1,3, 5, 7 , , con 8, 
(9) = 6 , 1, 2, 4, 5, 7, 8 » y con 9, 
p(10) = 4 » 1,3,7,9 è » con 10. 
etc. 


Se observa que p(p) = p — 1 si p es primo, pues un número pri- 
mo p no tiene más divisores que él mismo y la unidad, y, por tanto, 
es primo relativo con todos los enteros 1, 2, 3, ..., p — 1. Si n es com- 
puesto, con la descomposición en factores primos 


n = pit pst. pr, 


donde las p representan números primos distintos, cada uno elevado 
a una cierta potencia, se tiene 


cdi) (2) d+) 


Por ej., puesto que 12 = 23 - 3, 


(12) = 12(1 — Ys) (1 — Ys) = 120/3) C/) = 4, 


como debía resultar, previo el cómputo de primos relativos con 12 y 
menores que él. La demostración general es completamente elemen- 
tal, pero no la daremos aquí. 
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*Ejercicla: Basándose en la función p de Euler, generalícese el teorema de 
Fermat de la página 44. El teorema general se enuncia así: Si n es un entero cual- 
quiera, y a es primo relativo con n, se tiene 


avía) = 1 (mód n). 





4. Fracciones continuas. Ecuaciones diofánticas.—El algoritmo de 
Euclides para el cálculo del máximo común divisor de dos enteros 
conduce de modo natural a un importante método para representar 
el cociente de dos enteros mediante una fracción compuesta; p. ej., 
aplicando a los números 840 y 611 el algoritmo de Euclides resultan 
las igualdades 


840 = 1 - 611 + 229, 611 = 2- 229 + 153, 
229 = 1 : 153 + 76, 153 = 2-76: + 1, 


las cuales demuestran, incidentalmente, que (840, 611) = 1. De estas 
ecuaciones se pueden deducir las siguientes expresiones: 


840,289, 1 
+=? us 
511,168, 

229 +29 + 229/153’ 
223 2,8, 

153 ~! tgs Ttt 153/76 ” 
1582, 1 

TA 


Por combinación de estas igualdades se obtiene el desarrollo del nú- 


, 840 
mero racional =— en la forma 


611 
840 _, 1 
sm =I + 1 
2 + 
1 
1+ 
1 
ET 
Una expresión de la forma 
1 
a=0 + CN TRA [7] 
a+ 
a+ 
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donde las a representan enteros positivos, se llama fracción continua. 
El algoritmo de Euclides da un método para representar todo número 
fraccionario en esta forma. 


Ejercicio: Hállense los desarrollos en fracción continua de 


2 43 169 
5° 30° 70 


*Las fracciones continuas son de gran importancia en la rama de la aritmé- 
tica superior conocida con el nombre de análisis diofántico. Una ecuación diofán- 
tica es una ecuación algebraica, con una o más incógnitas, de coeficientes enteros 
y de la que interesan únicamente las soluciones enteras. Tales ecuaciones pueden 
carecer de soluciones o tener un número finito o infinito de ellas. El caso más 
sencillo es el de la ecuación diofántica lineal con dos incógnitas, 


az + by = c, [8] 


donde a, b y e son enteros dados, y se buscan soluciones x, y enteras. La solución 
completa de una ecuación de esta forma puede hallarse por el algoritmo de Euclides. 

Para comenzar, hallemos d = (a, b) por el algoritmo de Euclides; se tendrá 
entonces, para k y 1 convenientes, 


ak + bl = d, [9] 


de donde resulta que la ecuación [8] admitirá la solución particular x = k, y = l 
en el caso en que sea c = d; En general, si c es un múltiplo de d, 


=d- q, 
se obtendría de [9] 
a(kq) + b(lq) = dq = c, l 

de modo que [8] tiene la solución particular x = x* = kq, y = y* = lq. Recípro- 
camente: si [8] tiene una solución x, y para un c dado, e debe ser múltiplo de 
d = (a, b), puesto que q, por dividir a a y b, debe dividir a c. Hemos probado así 
que, para que la ecuación [8] admita soluciones, es necesario y suficiente que c 
sea múltiplo de (a, b). 

Para determinar otras posibles soluciones de [8] observemos que si x = q’, 
y = y' es otra solución cualquiera, distinta de la x = x*, y = y* obtenida por el 
algoritmo de Euclides, las diferencias x = x’ — x*, y = y” — y* forman una solu- 
ción de la ecuación «homogénea» 


az + by = 0. [10] 
Pues si es 
ax’ + by = e€ y ax* + by* = c, 


restando miembro a miembro estas dos ecuaciones se obtiene 
a(x’ — x*) + by’ — y*) = 0. 


Ahora bien: la solución general de la ecuación [10] es x = rb/(a, b), y = —ra/(a, b), 
donde r es un entero cualquiera. (Dejamos al lector la demostración como ejercicio, 
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Indicación: Divídase por (a, b) y utilicese el ejercicio de la pág. 56.) Resulta enton- 
ces de modo inmediato que 


1 = x* + rb/(a, b), y = y* — ra/(a, b). 


En resumen: La ecuación diofántica lineal ar + by = c, donde a, b y c son 
enteros, tiene soluciones cuando, y únicamente entonces, c es múltiplo de (a, b). 
En este caso, se puede hallar una solución por el algoritmo de Euclides, y la solu- 
ción general es de la forma 


x = x* + rb/(a, b), y = y* — ra/(a, b), 


donde r es un entero cualquiera. 

Ejemplos: La ecuación 3x + 6y = 22 no admite soluciones enteras, puesto 
que (3, 6) = 3 no divide a 22. 

La ecuación 7z + 11y = 13 tiene la solución particular z = —39, y = 26, 
obtenida en la forma siguiente: 


lli=1:7+4, 7m1:4+3, 4=1:3+1 (7,11) =1. 
1=4-3=4-(7-4)=2:4-7=2(11-7)-7=2-11-3-7. 


De donde 
7+(-3) +11(2) =1, 
7 + (— 39) + 11(26) = 13. 


Las demás soluciones vienen dadas por las fórmulas 
z = — 39 + 11r, y = 26 — 7r, 
siendo r un entero arbitrario. 


Ejercicio: Resuélvanse las ecuaciones diofánticas: a) 3x — 4y = 29; b) 11z + 
+ 12y = 58; c) 153x — 34y = 51. 


CAPÍTULO II 
SISTEMAS DE NÚMEROS 


Introducción. —Debemos extender suficientemente el concepto ini- 
cial de número, como número natural, hasta: crear un instrumento 
capaz de satisfacer las necesidades de la práctica y de la teoría. En 
una larga y, a veces, titubeante evolución histórica fueron gradual- 
mente aceptados el cero, los enteros negativos y las fracciones, en el 
mismo plano que los enteros positivos, y hoy día las reglas operativas 
con estos números son del dominio de todo estudiante de bachillerato. 
Pero para alcanzar completa libertad en las operaciones algebraicas 
debemos ir más allá, hasta incluir en el concepto de número las canti- 
dades irracionales y complejas. Aunque estas extensiones del concepto 
de número natural han sido utilizadas en matemática durante varios 
siglos y, por otra parte, constituyen la base de toda la matemática 
moderna, hasta tiempos relativamente recientes no fueron establecidas 
sobre una base lógica sólida. En el presente capítulo haremos una 
exposición del modo como dicha base fué alcanzada. 


I. LOS NÚMEROS RACIONALES 





1. Los números racionales como resultado de mediciones.—Los 
números enteros son abstracciones del proceso de contar colecciones 
finitas de objetos. Pero en la vida diaria no es suficiente poder contar 
objetos’ individuales, es preciso también medir cantidades tales como 
longitudes, áreas, pesos y tiempo. Si se quiere operar sin obstáculos 
con las medidas de estas cantidades, que son susceptibles de subdivi- 
siones arbitrariamente pequeñas, es necesario extender el campo de 
la aritmética más allá de los números enteros. El primer paso será el 
de reducir el problema de la medida al de contar. Comenzaremos por 
elegir, de modo completamente arbitrario, una unidad de medida 
—metro, pie, gramo, libra, segundo, etc.—a la que asignaremos la 
medida 1. Luego, contaremos el número de esas unidades contenidas 
en la cantidad que deseamos medir; p. ej., una cierta masa de plomo 
pesa exactamente 54 Kg. Sin embargo, el proceso de contar no es 
suficiente en general, ya que la cantidad dada puede no ser exacta- 
mente medible mediante múltiplos enteros de la unidad elegida. Las 
más de las veces podremos decir únicamente que dicha cantidad está 
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comprendida entre dos múltiplos consecutivos de la unidad; p. ej., entre 
53 Kg y 54 Kg. Cuando esto ocurra, avanzaremos un paso introdu- 
ciendo nuevas subunidades, obtenidas por subdivisión de la unidad 
inicial en un cierto número n de partes iguales. En el lenguaje ordina- 
rio, estas nuevas subunidades pueden tener nombres especiales; p. ej., 
el pie se divide en 12 pulgadas; el metro, en 100 centímetros; la libra, 
en 16 onzas; la hora, en 60 minutos; el minuto, en 60 segundos, etc. 
Sin embargo, en el simbolismo de las matemáticas, una subunidad 
obtenida dividiendo la unidad inicial en n partes iguales se designa 
con el símbolo 1/n; y si una cantidad contiene exactamente m de estas 
subunidades, su medida se denota con el símbolo m/n. Este símbolo 
se llama fracción o razón (a veces se escribe m : n). El paso siguiente, 
verdaderamente decisivo, sólo se dió de modo. consciente después de 
varios siglos de tentativas. El resultado fué que el símbolo m/n quedó 
desposeído de referencias concretas a procesos de medidas y a las can- 
tidades medidas, y fué considerado simplemente como un número, un 
ente en sí mismo, en el mismo plano que los números naturales. Cuando 
m y n son números naturales, el símbolo m/n se llama número racional. 

El uso de la palabra número (inicialmente reservada para los nú- 
meros naturales) para estos nuevos símbolos está justificado por el 
hecho de que la adición y la multiplicación de estos entes obedecen 
a las mismas leyes que rigen dichas operaciones con los números natu- 
rales. Para probar esto, debemos definir previamente la adición, la 
multiplicación y la igualdad de números racionales. Como es bien sa- 
bido, estas definiciones son: 


u c ad + be a € ac 
bd bad > b d`dd 11] 
al S Ee 
a ’ a DA 
para enteros cualesquiera a, b, c, d; p. ej.: 
2 4 2-5434 10412 22 2 4 2.4 38 
3 t3 3-5 15 “ia 3 5 T3 Tis 
3 i 8 6 2 
37? R2 9 3 


Estas definiciones se nos presentan forzosamente si deseamos que los 
números racionales sean apropiados para medir longitudes, áreas, etc. 
Pero hablando en sentido estricto, estas reglas de adición, multiplica- 
ción e igualdad de nuestros símbolos quedan establecidas por su pro- 
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pia definición y no aparecen impuestas por otras necesidades que las 
de ser no contradictorias y resultar útiles para las aplicaciones. A par- 
tir de las definiciones [1] se puede probar que las leyes fundamentales 
de la aritmética de los números naturales continúan siendo válidas en el 
dominio de los números racionales: 


P+qa=q+p (ley conmutativa de la adición), 
P+(+T) =por (ley asociativa de la adición), 
Pg =4p . (ley conmutativa de la multiplicación), [2] 
plar) = (pgr (ley asociativa de la multiplicación), 
pa +r) = pq + pr (ley distributiva). 


P. ej., la prueba de la ley conmutativa de la adición de fracciones 
resulta de las ecuaciones 


Ti ad + be cb + da c a 


en las cuales el primero y el último signo de igualdad corresponden a la 
definición [1] de la adición, mientras que el del centro es una conse- 
cuencia de las leyes conmutativas de la adición y de la multiplicación 
de números naturales. El lector puede comprobar las otras cuatro 
leyes de manera análoga. 
Para la efectiva comprensión de estos hechos se debe insistir una 

vez más en que los números racionales son creación nuestra, y que las 
reglas [1] dependen de nuestra voluntad. Podríamos haber definido 


caprichosamente la adición por la fórmula + + + = =. = 5, la cual 
habría dado en particular */, + */¿ = ?/,, lo que sería absurdo aplicado 
a la medición de cantidades. Reglas de tal tipo, aunque permisibles 
lógicamente, harían de la aritmética de nuestros nuevos símbolos un 
juego carente de sentido. El juego libre del intelecto debe estar guiado 
aquí por la necesidad de crear un instrumento capaz de ser utilizado 
para la medida. 

2. Necesidad intrínseca de la introducción de los números racio- 
nales. Principio de generalización.-—Junto a las razones prácticas que 
indujeron a la introducción de los números racionales, existen otras 
de carácter intrínseco y en cierto modo más apremiantes, que vamos 
a discutir independientemente de los argumentos anteriores. Estas 

_ razones son de carácter aritmético y típicas de una tendencia domi- 
nante en el proceso matemático. 

En la aritmética ordinaria de los números naturales se pueden 
efectuar siempre las dos operaciones fundamentales: ‘adición y mul- 
tiplicación. En cambio, las operaciones inversas no son siempre posi- 
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bles. La diferencia b — a de dos enteros a, b es el entero c tal que 
a + c = b; es decir, es la solución de la ecuación a + z = b. Pero en 
el dominio de los números naturales el símbolo b — a posee signifi- 
cación únicamente cuando es b > a, ya que únicamente entonces tiene 
la ecuación a + x =b una solución que sea un número natural. Un gran 
paso para suprimir esta restricción se dió cuando se introdujo el sím- 
bolo O mediante la relación a — a = 0. De mayor importancia aún fué 
la introducción de los símbolos —1, —2, —-3, ..., junto con la definición 


b — a = —(a — b) 


para el caso b < a, que permitió la sustracción, sin restricciones, en 
el dominio de los enteros positivos y negativos. Para incluir los nuevos 
símbolos —1, —2, —3, ..., en una aritmética más amplia, que com- 
prenda tanto los enteros positivos como los negativos, debemos, 
naturalmente, definir las operaciones con ellos de tal manera que las 
reglas de las operaciones aritméticas con los números naturales se con- 
serven para el nuevo dominio; p. ej., la regla 


(- 1)(-1)= 1, [3] 


que servirá para regir la multiplicación de los enteros negativos, es 
una consecuencia del deseo de conservar la ley distributiva a(b + c) = 
= ab + ac. Puesto que si hubiéramos convenido, p. ej., en que fuera 
(—D (1D =-1, poniendo a=—1, b=1, c= —1 resultaría 
--1(1— 1) = —1 — 1 = —2, mientras que por otro lado se tendría 
—1(1 — 1) = —1 - 0 = 0. Fué necesario mucho tiempo para que los 
matemáticos comprendieran que la «regla de los signos» [3], junto con 
todas las demás definiciones que se refieren a los enteros negativos y 
a las fracciones, no podían ser «demostradas». Todas eran creaciones 
hechas con objeto de alcanzar libertad en las operaciones, conservando 
siempre las leyes fundamentales de la aritmética. Lo que puede—y 
debe—probarse es únicamente el hecho de que con tales definiciones 
las leyes conmutativa, asociativa y distributiva de la aritmética se 
conservan. Aun el gran matemático Euler dió un argumento poco con- 
vincente para mostrar que (—1) (—1) «debe» ser igual a +1. Decía: 
dicho producto debe ser +1 ò —1, pero no puede ser —1, puesto 
que —1 = (+1) (—1). : 

Del mismo modo que la introducción de los enteros negativos y del 
cero despejó el camino para la sustracción sin restricciones, la introduc- 
ción de los números fraccionarios suprime análogos obstáculos para la di- 
visión. El cociente r=b/a de dos enteros a y b, definido por la ecuación 


arz = b, [4] 
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existe, como entero, únicamente cuando a es un divisor de b. Si no es 
ése el caso, como, p: ej., si es a = 2, b = 3, introducimos simplemente 
el símbolo bja, al que llamamos fracción, para el que establecemos la 
regla: a(b/a), = a, de modo que bja es, «por definición», una solución 
de [4]. La introducción de las fracciones como nuevos números hace 
posible la división sin restricciones, excepto la división por cero, la cual 
será excluida en todos los casos.. 

Expresiones del tipo 1/0, 3/0, 0/0, etc., serán siempre símbolos sin 
significado para nosotros, puesto que si se admitiera la división por 
cero, podriamos deducir de ecuaciones correctas, como 0 -1=0- 2, 
la consecuencia absurda 1 = 2. Sin embargo, a veces puede ser útil 
designar expresiones del tipo 3/0 por el símbolo co (léase «infinito», 
siempre que no se pretenda operar con el simbolo co como si estuviera 
sujeto a las leyes ordinarias del cálculo numérico. 

La significación aritmética propia del sistema de todos los números 
racionales—enteros y fraccionarios, negativos y positivos—resulta 
ahora clara. Para el dominio de los números así extendido no sólo 
valen las leyes formales asociativa, conmutativa y distributiva, sino 
que ahora también las ecuaciones a + x = b y ax = b tienen las so- 
luciones x = b — a y x = bja, sin restricción alguna, con tal que para 
la última se tenga a + 0. En otros términos, en el dominio de los 
números racionales las llamadas operaciones racionales—adición, sus- 
tracción, multiplicación y división—son posibles sin restricción y los 
resultados pertenecen siempre a aquel dominio de números. Un domi- 
nio de números cerrado respecto de dichas operaciones se llama un 
cuerpo. Daremos otros ejemplos de dista más adelante, en este ca- 
pítulo y en el siguiente. 

Extender un dominio por la introducción de nuevos símbolos, de 
tal modo que las leyes que valen 'en el primero continúen rigiendo en 
el segundo, es uno de los aspectos del proceso de generalización carac- 
terístico de la matemática. La generalización del concepto de número 
natural al de número racional satisface, por una parte, la necesidad 
teórica de suprimir las restricciones a la sustracción y a la división, 
y cumple, por otra, la necesidad práctica de tener números para re- 
presentar los resultados de mediciones. Del hecho de que los números 
racionales satisfagan esa doble necesidad resulta verdaderamente su 
gran importancia. Como hemos visto, esta extensión del concepto de 
número ha sido posible por la creación de nuevos números en la forma 
de. símbolos abstractos tales como 0, —2, y ?*/,. Hoy, acostumbrados 
como estamos a tratarlos como cosa corriente, resulta difícil creer 
que hasta el siglo xvi no fueron admitidos con los mismos derechos 
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que los enteros positivos y que, aunque usados cuando se hacían 
necesarios, no era sin ciertas dudas y prevenciones. A la natural 
tendencia humana a apoyarse en lo concreto, y como tales aparecían 
los números naturales, se debe la lentitud con que se dió este paso 
inevitable, Únicamente en el dominio de lo abstracto puede ser creado 
un sistema satisfactorio de aritmética. 

3. Interpretación geométrica de los números racionales. —La cons- 
trucción que sigue dará una interpretación geométrica intuitiva del 
sistema de los números racionales. 

Tomemos sobre una recta, «recta numérica», un segmento de O a 1 
(Fig. 8). Elijamos dicho segmento como unidad de longitudes, unidad 
que puede ser tomada arbitrariamente. Los enteros positivos y negati- 
vos serán representados por puntos equidistantes sobre la recta numé- 
rica, los positivos a la derecha del O y los negativos a la izquierda. 


o 
-3 -2 -1 0 34 2 3 
Fic. 8.—La recta numérica. 


Para representar las fracciones de denominador n, dividimos cada uno 
de los segmentos de longitud unidad en n partes iguales; los puntos 
de subdivisión representan. las fracciones con denominador n. Si efec- 
tuamos esa construcción para todo entero n, todos lòs números racio- 
nales vendrán representados por puntos de la recta numérica. Llama- 
remos a los puntos así obtenidos puntos racionales, y usaremos las 
expresiones «número racionals y «punto racional» como equivalentes. 

En el capítulo primero, I, se definió la relación A < B para nú- 
meros naturales. Esta relación tiene una interpretación en la recta 
numérica, que resulta del hecho de que si un número natural A es 
menor que otro B, el punto A está a la izquierda del punto B. Esta re- 
lación geométrica tiene significado para todos los puntos racionales, por 
lo que parece natural intentar extender la relación aritmética a los nú- 
meros racionales, de modo que corresponda al orden geométrico de los 
puntos racionales. Se llega a ese resultado con la definición siguiente: 
Diremos que el número racional A es menor que el número racional B 
(A < B), y B se dice mayor que A (B > A) cuando B — A es positivo, 
De la definición se sigue que, si es A < B, los puntos (números) entre 
A y B son aquellos que satisfacen simultáneamente las condiciones de 
ser > A y < B. Todo par de puntos distintos, junto con los puntos 
comprendidos entre ellos, forman el segmento o intervalo [A, B}. 

La distancia de un punto A al origen, considerada como positiva, 
se llama valor absoluto de A y se indica con el símbolo 

14] 
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Es decir; si es A 3 0, se tiene | A | = A; y si es A Z 0, se tiene 
| A| = —A. Es fácil ver que si A y B tienen el mismo signo, vale la 
igualdad | A + B| =|A |+ |B |; mientras que si A y B tienen sig- 
nos distintos, es | A + B|<]A|+IB]. Por tanto, combinando 
estos dos resultados, se tendrá en todo caso 


lA+B|<|A|+1Bl, 


cualesquiera que sean los signos de A y B. 

Para la representación que consideramos se tiene la siguiente pro- 
posición de fundamental importancia: Los puntos racionales forman un 
conjunto denso en la recta. Con esto se quiere decir que interiores a 
todo intervalo, por pequeño que sea, hay siempre puntos racionales. 
Basta tomar el denominador n suficientemente grande, de modo que 
el intervalo [0,1/n] sea más pequeño que el intervalo [4, B] en cues- 
tión, para que al menos una de las fracciones m/n sea interior a él. No 
existen, por tanto, intervalos, por pequeños que sean, vacíos de pun- 
tos racionales. Resulta también que en todo intervalo debe haber infi- 
nitos puntos racionales; puesto que si hubiera solamente un número 
finito de ellos, el intervalo determinado por“dos consecutivos no podría 
contener puntos racionales, en oposición a lo que acabamos de probar. 


I. SEGMENTOS INCONMENSURABLES, NÚMEROS IRRACIONALES 
Y CONCEPTO DE LÍMITE 


1. Introducción.—Cuando se comparan las longitudes de dos seg- 
mentos rectilíneos a y b, puede ocurrir que a esté contenido un número 
r exacto de veces en b. En este caso podemos expresar la medida del 
segmento b tomando como unidad a y diciendo que la longitud de b 
es r veces la de a. Pero puede ocurrir que, mientras que ningún múl- 
tiplo entero de a sea igual a b, se pueda dividir a en un cierto número 
de partes iguales, p. ej., n, cada una de longitud a/n y tales que un 
múltiplo entero m del segmento a/n sea igual a b: 





DA u] 
n 
Cuando se tiene una igualdad de la forma [1] diremos que los dos 
segmentos a y b son conmensurables, dado que tienen una medida 
común: el segmento ajn está contenido n veces en a y m veces en b. 
El conjunto de todos los segmentos conmensurables con a estará cons- 
tituído por aquellos segmentos cuya longitud puede ser expresada en 
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la forma [1], para enteros m y n convenientes (n + 0). Si tomamos a 
como segmento unidad [0,1], en la figura 9, los segmentos conmensu- 


—A A e do —— o A rc io 
23 -1 04 14 42 3 


Fic. 9.—Los puntos racionales. 


rables con el segmento unidad corresponderán a todos los puntos ra- 
cionales m/n sobre la recta numérica. Para todas las cuestiones prác- 
ticas relacionadas con la medida, los números racionales son suficientes, 
Incluso desde un punto de vista teórico, como los puntos racionales 
cubren la recta densamente, podría pensarse que todos los puntos dé 
la recta fueran racionales. Si esta sospecha fuese cierta, todos los seg- 
mentos serían conmensurables con la unidad. Uno de los descubrimien- 
tos más sorprendentes de los primeros matemáticos griegos (la escuela 
pitagórica) fué el de que las cosas no sucedían de modo tan simple. 
Existen segmentos inconmensurables y, si suponemos que a todo seg- 
mento corresponde un número, como medida de su longitud con un 
segmento unidad, existen también números irracionales. Este descu- 
brimiento fué un acontecimiento científico de la máxima importancia. 
Posiblemente señala el origen de lo que puede considerarse como 
contribución específica de los griegos a los procesos rigurosos de las 
matemáticas. Es evidente que este hecho afectó profundamente la 
matemática y la filosofía desde la época griega hasta nuestros días. 

La teoría de los inconmensurables de Eudoxio, presentada en for- 
ma geométrica en los Elementos de Euclides, es una obra maestra de 
la matemática griega, frecuentemente omitida en las desfiguradas ver- 
siones didácticas de los Elementos. Dicha teoría no fué apreciada en 
su justo valor hasta el siglo pasado, después que Dedekind, Cantor y 
Weierstrass construyeron una teoría rigurosa de los números irracio- 
nales. Expondremos aquí la teoría de los inconmensurables en la 
forma aritmética moderna. 

Antes de nada probaremos que la diagonal del cuadrado es .incon- 
mensurable con.su lado. Supongamos que se ha tomado como unidad 
de longitud el lado del cuadrado y que la diagonal tiene una longitud z. 
Entonces, por el teorema de Pitágoras, se tendrá 


2=124+12=2, 


(Designamos x con el símbolo 4/2.) Si x fuese conmensurable con 1, 
existirían dos enteros p y q tales que x =. p/q, y 


p? = 2q?. (2) 
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Supongamos p/q irreducible, ya que puede suprimirse todo factor co- 
mún al numerador y denominador. Puesto que 2 aparece como factor 
en el segundo miembro, p? tiene que ser un número par, de donde 
resulta que p debe ser par, pues el cuadrado de todo número impar es 
impar. Podemos, por tanto, escribir p = 2r, Al sustituir este valor 
en [2] se tiene 


4r? = 292, oloqueeslo mismo, 2r? = q?, 


Por ser 2 un factor del primer miembro de la última igualdad, q2 es 
par y, en consecuencia, también lo es q. Resultan así p y q divisibles 
por 2, lo que contradice la hipótesis de que p y q no tenian factores 
comunes; en consecuencia, no se puede tener la igualdad [2]; es decir, 
z no puede ser un número racional. 

Nuestro resultado puede ser expresado por la proposición: no 
existe ningún número racional igual a y/2. 

Del argumento precedente resulta qué, mediante una construcción 
geométrica muy sencilla, se puede obtener un segmento inconmensu- 
rable con el segmento unidad. Si con un compás llevamos dicho segmen- 
to sobre la recta numérica, en la forma indicada en la figura 10, el 
punto obtenido no puede coincidir con ninguno de los puntos raciona- 

les: El sistema de los números raciona- 

les, aunque denso en toda ella, no cu- 

bre toda la recta numérica. A una men- 

te ingenua debe resultarle ciertamente 

0 1 Y extraño y paradójico que el conjunto 

Fie. 10.—Construcción de VZ. denso de los puntos racionales no Ìle- 

na la recta completa. Nada en nues- 

tra «intuición» puede ayudarnos a «ver» los puntos irracionales como 

distintos de los racionales. No es de extrañar que el descubrimiento 

de los inconmensurables produjera gran impresión en los filósofos y 

matemáticos griegos, y que aún hoy le ofrezca, a quien medite sobre 
la cuestión, cierta perplejidad. 

Es fácil construir tantos segmentos inconmensurables con la uni- 
dad como se desee. Los extremos de tales segmentos llevados a partir 
del O de la recta numérica son los llamados puntos irracionales. Ahora 
bien: el principio que sirvió para introducir las fracciones fué el de 
medir las longitudes con números, y deseamos en lo que sigue conser- 
var este principio y tratar de acuerdo con él los segmentos inconmen- 
surables con la unidad. Si queremos que exista una correspondencia 
mutua entre números, de una parte, y puntos de la recta, de otra, es 
preciso introducir los números irracionales. 
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Resumiendo en lo posible la situación, se puede decir que un nú- 
mero irracional representa la longitud de un segmento inconmensurable 
con la unidad. En las secciones que siguen precisaremos esta definición 
un poco vaga y completamente geométrica, hasta llegar a otra más 
satisfactoria desde el punto de vista del rigor lógico. Nuestras prime- 
ras consideraciones a este propósito partirán de las propiedades de 
las fracciones decimales. 


Ejercicios: 

1. Demuéstrese que Y 2, y3, v5, Y 3 no son racionales. (Indicación: Utilícese 
el lema de la página 54.) 

2. Pruébese que V2 + V3 y VŽ + Y2 no son racionales. (Indicación: Si, 
p. ej., el primero de estos números fuera igual a un número racional r, poniendo 
V3=r-— y? y elevando al cuadrado, y2 resultaría racional.) 

3. Demuéstrese que V2 + y3 + v5 es irracional. Inténtese construir ejem- 
plos análogos y más generales. , 


2. Fracciones decimales. Decimales de infinitas cifras.—Para cu- 
brir la recta numérica con un conjunto de puntos denso en toda ella 
no son necesarios todos los números racionales; bastan, por ejemplo, 
los números obtenidos por subdivisión de cada intervalo unidad en 10, 
luego en 100, 1000, etc., segmentos iguales. Los puntos así obtenidos 
corresponden a las «fracciones decimales»; p. ej., el punto 0,12=1/10+ 
+2/100 corresponde al punto situado en el primer intervalo unidad, 
en el segundo subintervalo de longitud 1071, y en el origen del tercer 
«sub-sub-» intervalo de longitud 10-2. (a-2 significa 1/a2.) Si una frac- 
ción decimal contiene n cifras después de la coma, tiene la forma 


f =z + ar10-1 + ag10-2 + agl0-3 +... + an10-”, 


donde z es un entero y las a son cifras—0, 1, 2, ..., 9 —que indican las 
décimas, centésimas, y así sucesivamente. El número f se representa 
en el sistema decimal en la forma abreviada 2,4,4203...4n. Se ve inme- 
diatamente que estas fracciones pueden escribirse en forma de frac- 
ción p/q, siendo q = 10%; p. ej, f= 1,314 = 1 + 3/10 + 1/100 + 
+ 4/1000 = 1314/1000. Si p y q tienen un divisor común, la fracción 
podrá reducirse a otra cuyo denominador será divisor de 102, Por 
otra parte, ninguna fracción irreducible cuyo denominador no sea di- 
visor de alguna potencia de 10 puede venir representada por una frac- 
ción decimal; p. ej., 1/5 = 2/10 = 0,2 y 1/250 = 4/1000 = 0,004; en 
cambio, 1/3 no puede ser escrita como número decimal de n cifras, 
por grande que sea n, ya que una igualdad de la forma 


1/3 = b/102 
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conduciría a 
102 = 3b, 


lo que es absurdo, ya que 3 no es factor de ninguna potencia de 10. 

Tomemos sobre la recta numérica un punto P que no corresponda 
a ninguna fracción decimal; p. ej., el punto racional 1/3 o el punto 
irracional 4/2. Entonces, por el proceso de subdivisión del intervalo 
unidad en diez partes iguales, y luego en cien y así sucesivamente, el 
punto P no será nunca origen de ninguno de los subintervalos parcia- 
les. Sin embargo, P puede ser incluído dentro de intervalos cada vez 
más pequeños de la subdivisión decimal, con el grado de aproximación 
que se desee. Este proceso de aproximación puede ser descrito en la 
forma siguiente: supongamos que P está en el primer intervalo uni- 
dad; subdividiendo este intervalo en 10 partes iguales, cada una de 
longitud 10-1, supongamos que P está en el tercero de tales intervalos. 
Diremos entonces que P está entre las fracciones decimales 0,2 y 0,3, 
Subdividimos entonces el intervalo de 0,2 a 0,3 en 10 partes iguales, 
cada una de longitud 10-2, y supongamos que P está en el cuarto 
de tales intervalos. Subdividamos éste a su vez y supóngase que P 
está en el primero de estos intervalos de longitud 10-3. Podremos decir 
entonces que P está entre 0,230 y 0,231. Este proceso puede conti- 
nuarse indefinidamente, dando lugar a una sucesión ilimitada de ci- 
fras, a1, d2, 43, ..., An, ..., Con la propiedad siguiente: para todo valor 
del entero n, el punto P está incluído en el intervalo In, cuyo origen es la 
fracción decimal 0,ajazaz ... an-ıđ&n y cuyo extremo es 0,ajag0z ... 
An-¡ (An + 1), siendo 10-2 la longitud de Jn. Si elegimos la sucesión 
n = l, 2, 3, 4, ..., vemos que cada uno de los intervalos J,, I2, ly, ..., 
está contenido en el precedente, mientras que-sus longitudes-10-1, 
102, 103, ..., tienden a cero. Diremos que P está contenido en una 
sucesión de intervalos decimales encajados; p. œj., si P es el punto 
racional 1/3, todas las cifras a,, az, az, ... son iguales a 3, y P está 
contenido en todo intervalo Iņ cuyos extremos sean 0,333...33 y 
0,333 ... 34; es decir, 1/3 es mayor que 0,333...33 y menor que 0,333...34, 
donde el número de cifras puede ser arbitrariamente grande. Expresa- 
remos este hecho diciendo que el número decimal de n cifras 0,333 ... 33 
«tiende hacia 1/3» al crecer n, y escribiremos 


1/3 = 0,333 ,..; 


los puntos indican que la fracción decimal debe extenderse «indefini- 


damente». 
El punto irracional y/2 antes definido conduce también a una frac- 
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ción decimal que se extiende indefinidamente; sin embargo, en este 
caso, la ley que determina los valores de las cifras de la sucesión no 
es sencilla. En efecto, no se conoce ninguna fórmula explícita que de- 
termine las cifras de la sucesión, aunque se pueden calcular tantas 
como se desee: 
12=1<2<22=4 
(1,4)? = 1,96 < 2 < (1,5)? = 2,25 
(1,41)? = 1,9881 < 2 < (1,42)? = 2,0264 
(1,414)2 = 1,999396 < 2 < (1,415)? = 2,002225 
(1,4142)? = 1,99996164 < 2 < (1,4143)? = 2,00024449, etc. 


Como definición general diremos que un punto P que no esté 
representado por una fracción decimal con un número finito n de 
cifras, está representado por la fracción decimal infinita, z,a10%03 ...., 
si para cualquier valor de n el punto P está situado en el intervalo 
de longitud 10-T con origen en el punto 2,a,0243 ... An. 

De este modo se establece una correspondencia entre los puntos 
de la recta numérica y todas las fracciones decimales finitas e infinitas. 
Esto sugiere la siguiente definición: un «número» es una fracción de- 
cimal finita o infinita. Los decimales infinitos que no representan nú- 
meros racionales serán llamados números irracionales. 

Hasta mediados del siglo pasado, las consideraciones precedentes 
eran aceptadas como una exposición satisfactoria del sistema de los 
números racionales e irracionales, sistema designado con el nombre 
de continuo numérico. El avance enorme de las matemáticas a partir 
del siglo xvin, en particular el desarrollo de la geometría analítica y 
del cálculo diferencial e integral, se hace sin riesgo con este concepto 
de sistema numérico como base. Pero durante el período de examen 
crítico de los principios y de consolidación de los resultados, fué 
abriéndose paso la idea de que el concepto de número irracional re- 
quería un análisis más preciso. Como preliminar a nuestra exposición 
de la teoría moderna del continuo numérico, discutiremos en forma 
más o menos intuitiva el concepto básico de límite. 


Ejercicio: Calcúlese Y 2 y Y5 con una aproximación de 10-2. 


3. Límites. Progresiones geométricas indefinidas.—Como vimos en 
la sección precedente, ocurre a veces que un cierto número racional s 
viene aproximado por una sucesión de otros números racionales sn, en 
la cual el índice n toma sucesivamente los valores 1, 2, 3, ... ; p. ej., si 
es s = 1/3, la sucesión de números racionales s, = 0,3, sz = 0,33, 
s3 = 0,333, etc., tiende hacia s. Pará tener otro ejemplo, dividamos el 
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intervalo unidad en dos mitades, la segunda mitad en otras dos par- 
tes iguales, y así sucesivamente, hasta que los dos menores intervalos 
obtenidos sean de longitud 2-2, donde n es arbitrariamente grande; 
es. decir, n = 100, n = 100 000, o el número que queramos. Suman- 
do entonces todos los intervalos, excepto el último, obtenemos una 
longitud total igual a 


1 1 1 1 1 
e ty tg tigt e ta (3) 
Vemos que sy difiere de 1 en (1/2)%, y que esta diferencia llega a ser 
arbitrariamente pequeña, o «tiende a cero» cuando n crece indefinida- 
mente. Carece de sentido decir que la diferencia es cero cuando n es 
infinito. El infinito aparece únicamente en el proceso y no como una 
cantidad efectiva. Podemos describir el comportamiento de sp diciendo 


que la suma Sn se aproxima a 1 cuando n tiende a infinito, y escribir 


1 1 
atte. (4) 


a. 
"tata 


1 
2. tzat 


2 
donde en el segunda miembro se tiene una serie indefinida o infinita. 
Esta «ecuación» no significa que debamos sumar efectivamente infi- 
nitos sumandos; es sólo una expresión abreviada para el hecho de que 
1 es el límite de la suma finita sn cuando n tiende a infinito (no que 
es infinito). Así, la ecuación [4], con su símbolo incompleto «+ ...», es 
sólo una manera breve de escribir la proposición precisa: 


1 = al límite, cuando n tiende hacia infinito, de la cantidad 


1 1 1 1 5 
=>) tata toeta [5) 


En forma más abreviada, pero más expresiva, se puede. escribir 


3n—> 1 cuando n> 00. [6] 


Como otro ejemplo de límite, consideremos las potencias de un 
número q. Si es —1 < q < 1; p. ej., q = 1/36 q = —4/5, la sucesión 
de potencias de q, | 

LA q?, q’, qa%..., qP,- 


se aproxima a cero cuando n crece. Si q es negativo, el signo de q»? 
será alternativamente + ó —, y q2 tenderá a cero aproximándose a 
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este valor a derecha e izquierda, alternativamente. Para q = 1/3 se 
tiene q? = 1/9, q$ = 1/27, qt = 1/81; ... , mientras que si es q = —1/2, 
se tendrá q? = 1/4, 4 = —1/8, q4 = 1/16, ... Diremos que el límite 
de q», cuando n tiende a infinito, es cero, o, en símbolos ` 


g2>0 cuando n=>00, para —1<gq<l. [7] 


(Incidentalmente, si q > 16 q < —1, q2 no tiende hacia cero, sino 
que su valor absoluto crece sin límite.) 

Para dar una demostración rigurosa de la proposición contenida 
en [7] partimos de la desigualdad probada en la página 22, la cual 
decía que (1 + p)? S 1 + np para todo entero positivo n y p >-—1. 
Si q es un número fijo entre 0 y 1, p. ej., q = 9/10, se tiene q =1/(1 +p), 
siendo p > 0. De ahí resulta 


1 
y T0 tP" > 1+ np e 


o (véase la regla 4, Cap. VI, suplemento I, 1) 


T a. 
0<qr< Tn 
Por consiguiente, q? está comprendido entre el valor fijo 0 y (1/p)- 
«(1/n), que se aproxima a cero al crecer n, puesto que p es fijo. De 
aquí resulta evidentemente que q2 —> 0. Si q es negativo, se tiene 
q = —1/(1 + p) y, en vez de las cotas anteriores 0 y (1/p) (1/n) apa- 
recen ahora, respectivamente, (—1/p) (1/n) y (1/p) (1/n). Por lo de- 
más, el razonamiento es el mismo. 
Consideremos ahora la progresión geométrica 


sm=14+9+94+q4+...+q%. [8] 


(El caso q = 1/2 fué discutido antes.) Como vimos en la página 20, 
se puede expresar Sn en una forma concisa y simple. Multiplicando 
Sn por q, encontramos 


qsa =q +04 + + qna, [8a] 


y restando [8a] de [8], vemos que desaparecen todos los términos 
excepto el 1 y el q2+1, obteniendo 


(1 — q)Sn = 1 — q+, 
o, por división, 
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El concepto de límite interviene al hacer crecer n. Como hemos visto, 
q+! = q + qu tiende a cero si es —1 <q < 1l, y por paso al límite 
se obtiene 


1 
Sn > LR cuando n > 00, para —1<qg<l. [9] 


Escrito como progresión geométrica indefinida (serie) resulta 


1 
e e A e pa od [10] 


Por ejemplo, 





1 1 1 
1+ +a ta teo [IM 
t ttg t ip? 
de acuerdo con la ecuación [4], y análogamente 
9 9 9 9 9 1 i 
10 102 + 10s Y Toa +: To 1 = 1/10 


de forma que 0,99999 ... = 1. Del mismo modo se tiene que el número 
decimal finito 0,2374 y el decimal infinito 0,237399999 ... representan 
el mismo número. 

En el capítulo VI daremos un resumen de una exposición general 
del concepto de limite dentro del moderno espíritu rigorista. 


Ejercicios: 
1 
1. Pruébese que 1 T e a re Igi< 1. 
q 
2. ¿Cuál es el límite de la sucesión a, ag, 43, . - . , donde es an = n/(n + 1)? 


(Indicación: Escríbase el término an en la forma n/(n + 1) = 1 — 1/(n + 1) y 
obsérvese que el último término del segundo miembro tiende a cero.) 


n+n>+1 


3. ¿Cuál es el límite de 1 para n—> coo? (Indicación: Póngase la 


expresión en la forma 


1 
4. Pruébese, para |q| < 1, que 1 + 2q + 3g? + 4g3+ ... = KET 


(Indicación: Utilícese el resultado del ejercicio 3 de la página 25.) 
5. ¿Cuál es el límite de la serie indefinida 


1 — 2g + 3g? — 4q +.. 
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142434. +n plt t.o tn 
r, de —— 


6. ¿Cuál es el límite de ET) > Pr y de 
183 +23 +... +3 , . 
CO T (Indicación: Utilicense los resultados de las páginas 19, 


21 y 22.) 


4. Números racionales y decimales periódicos. —Aquellos números 
racionales p/q que no son fracciones decimales finitas pueden ser des- 
arrollados en fracciones decimales indefinidas mediante el proceso de 
división decimal. En cada paso de este proceso debe haber un resto 
distinto de cero, ya que de otro modo la fracción decimal sería finita. 
Todos los restos distintos que aparecen en la división son enteros 
comprendidos entre 1 y q — 1, de modo que hay solamente q — 1 
posibilidades para los valores de dichos restos. Esto significa que al 
cabo de q cifras decimales, a lo sumo, algún resto k deberá repetirse, 
Pero todos los restos siguientes se repetirán eri el mismo orden en que 
aparecían después de este primer resto k. Esto prueba que la expresión 
decimal de cualquier número racional es periódica; una vez aparecido un 
cierto conjunto finito de cifras, dicho conjunto se repetirá infinitas 
veces; p. ej., 1/6 = 0,166666666...; 1/7 =.0,142857142857142857 ...; 
1/11 = 0,0909090909 ...; 122/1100 = 0,1109090909 ....; 11/90 = 
= (),12222222 ...; etc. (Cabe considerar que los números racionales 
que pueden ser representados mediante fracciones decimales finitas 
tienen: un desarrollo decimal periódico en el cual la cifra O se repite 
indefinidamente después de un número finito de cifras.) En algunos 
ejemplos anteriores se ve incidentalmente que ciertos desarrollos tie- 
nen una parte no periódica, que precede al período que se repite, 

Recíprocamente, se puede .probar que lodos los decimales periódicos 
son números racionales. Como ejemplo, consideremos el decimal pe- 
riódico indefinido 

p = 0,3322222... . 
Se tiene p = 33/100 + 10-3 - 2(1 + 10-1 + 102 + ...), donde la ex- 
presión. entre paréntesis es la serie geométrica 
1 + 10-1 + 10-24 10-8 +... = EA 
: 1-10 9 


Por tanto, 





33 zeio 10 2970 + 20 2990 299 
P= -00 t 9 ~ 9-105. ~ 9000 — 900 
La demostración en el caso general es esencialmente la misma, pero 
requiere una notación más general. En el decimal periódico general 


p =0,ajaza3... Ambibz. -` bnbiba . . . bnbiba. bn... 
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pongamos 0,bıbz ... bn = B, de manera que B represente la parte pe- 
riódica del decimal. Entonces, p puede escribirse así: 


p=0,a103... dm + 10-MB(1 + 10-78 + 10-204 10-30 4...) 


La expresión entre paréntesis es una serie geométrica con q = 10-29; 
su suma, de acuerdo con la ecuación [10] de la página 74, es 1/(1—10-2), 
y, por tanto, se tiene 
10-m B 
p = 0, Q102. . . dm e RR E ETE 


Ejercicios: 


1. Desarróllense las fracciones > 13 13 13 17" 2 en fracciones deci- 
males y determínese el período. 

*2. El número 142 857 tiene la propiedad de que multiplicado por cualquiera 
de los números 2, 3, 4,5 6 6 da otro que tiene las mismas cifras en diferente orden. 
Justifíquese esta propiedad, utilizando el desarrollo de 1/7 en fraccion decimal. 

3. Desarróllense los números racionales del ejercicio 1 como fracciones «de- 
cimales» en los sistemas de numeración de bases 5, 7 y 12. 

4. Desarróllese 1/3 como número diádico. 

5. Escríbase 0,11212121 ... como fracción ordinaria. Hállese el valor de dicho 
símbolo en los sistemas de numeración de base 3 ó 5. 


5. Definición general de los números irracionales mediante encajes 
.de intervalos.—En la página 71 adoptamos como definición provisio- 
nal la siguiente: un número es un decimal finito o infinito, y convenía- 
mos en que aquellos decimales infinitos que no correspondían a nú- 
meros racionales serían llamados números irracionales. Sobre la base 
de los resultados de la sección precedente podemos ahora formular 
esta definición en la siguiente forma: el continuo numérico, o sistema 
de números reales («real» en oposición a los números «imaginarios» o 
«complejos» que introduciremos en V) es la totalidad de los decimales 
infinitos. (Los decimales finitos quedan considerados como un caso 
- especial de los infinitos: aquel en que todas las cifras a partir de una 
de ellas son ceros; otra manera de considerarlos será la de reempla- 
zar la última cifra a por-a — 1 y hacerla seguir de una infinidad de 
cifras todas iguales a 9. Esto expresa el hecho de que 0,9999 ... = 1, 
de acuerdo con la sección 3.) Los números racionales son los decima- 
les periódicos; los números irracionales son los decimales no-periódicos. 
Sin embargo, esta definición no es aún plenamente satisfactoria, pues- 
to que, como hemos visto en el capítulo primero, el sistema decimal 
no se diferencia de los de otras bases por propiedades intrínsecas del 
sistema de números. En consecuencia, podíamos muy bien haber se- 
guido los razonamientos de las secciones precedentes utilizando el 
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sistema diádico u otro cualquiera. Por esta razón es de desear una 
definición más general del continuo numérico, independiente de espe- 
ciales referencias al sistema de base diez. Quizá la más sencilla sea 
la siguiente: 

Consideremos una sucesión cualquiera de intervalos J1, I2, ..., In, ... 
de la recta numérica, cuyos extremos sean puntos racionales, cada 
uno de los cuales esté contenido en el precedente, y tal que la longi- 
tud del intervalo n-ésimo In tienda a cero al crecer n. A una tal suce- 
sión la llamaremos sucesión de intervalos encajados o encaje de interva- 
los. En el caso de intervalos decimales, la longitud de In era 10-5; 
pero en el caso general puede ser muy bien 2-2, o estar simplemente 
sujetos a la restricción de ser menores que 1/n. En estas condiciones 
vamos a formular un postulado fundamental en' geometría: en corres- 
pondencia con cada sucesión de intervalos encajados existe precisamente 
un punto de la recta numérica que está contenido en todos los intervalos. 
(Se ve directamente que no puede haber más de un punto común a 
todos los intervalos, puesto que las longitudes de éstos tienden a cero 
y dos puntos no pueden estar contenidos en un intervalo de longitud 
menor que su distancia.) El punto a que se refiere el postulado es 
por definición un número real; si no es un punto racional, se dice que 
‘es un número irraciorial. Mediante esta definición establecemos una 
correspondencia perfecta entre puntos y números. Con ella damos una 
formulación más general a lo que expresábamos con la definición que 
utilizaba los decimales infinitos. : 

Al llegar a este punto quizá el lector se sienta inguiélado por una 
duda completamente legítima: ¿cuál es el «punto» de la recta numérica 
que hemos supuesto pertenecía a todos los intervalos de la sucesión, 
en el caso de que no se trate de un punto racional? Nuestra respuesta 
es: la existencia, en la recta numérica, de un punto contenido en cual- 
quier encaje de intervalos cuyos extremos sean puntos racionales es 
un postulado fundamental de la geometría. No es, por tanto, precisa la 
reducción lógica de esta proposición a otros hechos matemáticos. La 
aceptamos, lo mismo que aceptamos otros axiomas o postulados de la 
matemática, a causa de que es plausible de modo intuitivo, y también 
en virtud de su utilidad para la construcción de un sistema no contra- 
dictorio del proceso matemático. Desde un punto de vista puramente 
formal se podía haber partido de una recta constituida únicamente 
por puntos racionales y luego definir como punto irracional un símbolo 
que representa determinadas sucesiones de intervalos racionales encaja- 
dos. Un punto irracional queda así perfectamente determinado por la 
sucesión de intervalos en cuestión. Resulta, por tanto, que nuestro 
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postulado equivale a una definición. Establecer esta definición después 
de haber llegado a los encajes de intervalos racionales, gracias al sen- 
timiento intuitivo de que los puntos irracionales «existen», equivale a 
prescindir de los apoyos intuitivos con los que nuestro razonamiento 
está acostumbrado a proceder y darse cuenta de que todas las pro- 
piedades matemáticas de los puntos irracionales pueden venir expresa- 
das como propiedades de los encajes de intervalos racionales. 
Tenemos aquí un ejemplo típico de la posición filosófica descrita 
en la introducción de este libro; prescindir del ingenuo punto de vista 
«realista», que considera los objetos matemáticos como cosas en sí de 


e 
A 
oo e 
o. 
A 
A 
e — 
— a 
— e e je 
As cs e coran «ni 
ers m co am cerro p 





Fic. 11.—Encaje de intervalos. Límites de sucesiones, 


las cuales pretendemos modestamente determinar las propiedades, y, 
en cambio, comprobar que el único modo de existir de los objetos ma- 
temáticos que nos importa reside en sus propiedades matemáticas y 
en las relaciones que los ligan. Estas propiedades y relaciones agotan 
todos los aspectos posibles bajo los cuales puede intervenir un objeto 
en el mundo de la actividad matemática. Dejamos de lado la «cosa en 
- sí» matemática, del mismo modo que los físicos dejan de lado el in- 
observable éter; éste es el significado de la definición intrínseca de un 
número irracional como encaje de intervalos racionales. 

La cuestión matemática importante a este respecto es la de que 
para los números irracionales así definidos, se pueden generalizar de 
modo inmediato las operaciones de adición, multiplicación, etc., y las 
relaciones de «menor que» y «mayor que» establecidas para los núme- 
ros racionales, siendo dicha generalización de tal naturaleza que las 
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reglas y leyes válidas para los números racionales se conservan para 
los nuevos números; p. ej., la adición de dos números irracionales « 
y B puede venir dada por medio de los dos encajes de intervalos que 
sirvieron para definir « y B. Se construye una tercera sucesión de in- 
tervalos encajados sumando los valores de los orígenes y los de los 
extremos de los intervalos correspondientes a los dos encajes que de- 
finen a y f, y la nueva sucesión de intervalos encajados define a + PB. 
Análogamente se pueden definir el producto a f, la diferencia a — f 
y el cociente a/f. Sobre la base de estas definiciones se prueba: que 
las leyes aritméticas que discutimos anteriormente en este capítulo 
continúan siendo válidas para los números irracionales. Sin embargo, 
no daremos aquí los detalles de tales demostraciones. 

La comprobación de las leyes anteriores es simple y fácil, aunque 
resulta a veces enojosa para el principiante, que desea más bien apren- 
der las matemáticas como instrumento que analizar sus fundamentos 
lógicos. Algunos de los textos modernos de matemáticas repelen a nu- 
merosos estudiantes, debido a que comienzan con un análisis completo 
del sistema de los números reales, análisis que resulta un poco pedante. 
El lector que prescinde simplemente de esa introducción. procede con 
el mismo espíritu con que, hasta fines del siglo pasado, hicieron sus 
descubrimientos los más grandes matemáticos sobre la base del concepto 
«ingenuo» del sistema numérico que les. proporcionaba. su intuición. 

Desde el punto de vista físico, la definición de un número irracional 
mediante un encaje de intervalos corresponde a la determinación de 
una cantidad observable por una sucesión de medidas de aproxima- 
ción creciente. Toda operación de determinación, p. ej., de una longi- 
tud, tiene significación práctica dentro de los límites de un cierto 
error posible, error que mide la precisión de la operación. Puesto que 
los números racionales forman un conjunto denso en la recta, resulta 
imposible determinar para toda operación física, cualquiera que sea 
su precisión, si una longitud dada es racional o irracional. De aquí po- 
dría parecer que los números irracionales son superfluos para una 
adecuada descripción de los fenómenos físicos; sin embargo, como ve- 
remos más claramente en el capítulo VI, la ventaja efectiva que la 
introducción de los números irracionales aporta a la descripción ma- 
temática de-los fenómenos físicos es la de que dicha descripción se 
simplifica de modo notable, gracias a la posibilidad de utilizar libre- 
mente el concepto de límite, para el cual es fundamental el continuo 
numérico. ; 

*6. Otros métodos de definición de números irracionales. Corta- 
duras de Dedekind.—Otra manera de definir los números irracionales 
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fué dada por Richard Dedekind (1831-1916), uno de los grandes ini- 
ciadores del análisis lógico y filosófico de los fundamentos de la ma- 
temática. Sus obras Stetigkeit und irrationale Zahlen (1872) y Was 
sind und was sollen die Zahlen? (1887) ejercieron una profunda in- 
fluencia en los estudios sobre los fundamentos de la matemática. 
Dedekind prefería operar con ideas generales abstractas a hacerlo con 
sucesiones determinadas de encajes de intervalos. Su método está ba- 
sado en la definición de «cortadura» que vamos a exponer breve- 
mente. i i 

Supongamos que se ha dado un cierto método para dividir el con- 
junto de todos los números racianales en dos clases, A y B, tales que 
todo número b de la clase B es mayor que todo elemento a de la cla- 
se A. Toda clasificación de este tipo se llama una cortadura en el 
campo de los números racionales. Para una cortadura hay precisa- 
mente tres posibilidades, que se excluyen mutuamente: 

1) Hay en A un elemento máximo a*. Este es, p. ej., el caso cuan- 
do A está formada por todos los números racionales <1 y B por 
todos los números racionales >1. 

2) Hay en B un elemento mínimo b*, Así sucede, p. ej., si A está 
constituída por todos los números racionales < 1 y B por todos los 
números racionales >1. 

3) No: hay elemento máximo en A ni elemento mínimo en B. Se 
tiene, en particular, este caso cuando A está formada por todos los 
números racionales negativos, el 0, y todos los números racionales 
positivos cuyo cuadrado es menor que 2, y B por todos los números 
racionales positivos cuyo cuadrado es mayor que 2. A y B, reunidas, 
comprenden todos lós números racionales, puesto que hemos probado 
que no hay ningún número racional cuyo cuadrado sea igual a 2. 

"El caso en que A tuviera un elemento máximo a* y B un elemen- 
to mínimo b* es imposible, puesto que en dicho caso el número racio- 
nal (a* + b*)/2, que está comprendido entre a* y b*, sería mayor 
que el elemento máximo de A y más pequeño que el elemento mínimo 
de B, y no pertenecería a ninguna de las dos clases. 

En el tercer caso, aquel en el que no hay elemento máximo en A 
ni elemento mínimo en B, la cortadura, según Dedekind, define o 
simplemente es un número irracional. Es fácil ver que esta defini- 
ción concuerda con la dada mediante encajes de intervalos; cualquier 
sucesión Jı, I2, I3, ... de intervalos encajados define una cortadura, 
si colocamos en la clase A todos los números racionales que son me- 
nores que el origen de al menos uno de los intervalos In, y en B todos 
los demás números racionales. 


SEC. 111] OBSERVACIONES SOBRE GEOMETRÍA ANALÍTICA 81 
A A e O 


Desde un punto de vista filosófico, la definición de Dedekind de números 
irracionales representa un mayor grado de abstracción, puesto que no impone 
restricción alguna a la ley matemática que define las dos clases A y B. Un método 
más concreto de definir el continuo numérico real se debe a Georg Cantor (1845- 
1918). Aunque a primera vista parece completamente diferente del método de los 
encajes de intervalos y del de las cortaduras, en realidad es equivalente a ambos, 
en el sentido de que los sistemas numéricos definidos de las tres maneras gozan 
de las mismas propiedades. La idea de Cantor aparece sugerida por los dos hechos 
siguientes: 1) los números reales pueden considerarse como decimales de infi- 
nitas cifras, y 2) los decimales infinitos son límites de fracciones decimales finitas. 

Prescindiendo de la dependencia del sistema decimal se puede decir, siguiendo 
a Cantor, que toda sucesión ay, @2, a3, +. . de números racionales define un nú- 
mero real si dicha sucesión «converge». La convergencia significa que la diferencia 
(Am — An) entre dos números cualesquiera de la sucesión tiende a cero cuando 
Am Y An ocupan lugares suficientemente avanzados en la sucesión; es decir, cuando 
m y n tienden a infinito. (Las sucesivas aproximaciones decimales de todo número 
gozan de dicha propiedad, puesto que dos húmeros posteriores al n-ésimo difie- 
ren en menos de 10-12.) Dado que existen muchas formas de aproximarse al mismo 
número real mediante sucesiones de- números racionales, diremos que dos suce- 
siones convergentes de números racionales as, a2, 43,... y bı, ba, ba, ... definen 
el mismo número real si an — bn tiende a cero cuando n crece indefinidamente. Es 
fácil definir, para tales sucesiones, las operaciones de adición, multiplicación, etc. 


HI. OBSERVACIONES SOBRE GEOMETRÍA ANALÍTICA : 


1. El principio fundamental.—El continuo numérico, aceptado 
como cosa inmediata o bien después de un examen crítico, ha cons- 
tituído la base de las matemáticas—y en particular de la: geometría 
analítica y del cálculo—desde el siglo xvii. 

La introducción del continuo numérico hace posible asociar a cada 
segmento rectilíneo un determinado número real que da su longitud. 
Pero aún se puede ir más lejos: no sólo las longitudes, sino también 
-todo objeto geométrico y toda operación geométrica, pueden ser referidos 
al reino de los números. Los pasos decisivos en esta aritmetización de 
la geometría fueron dados por Fermat (1601-1655) en 1629 y por 
Descartes (1596-1650) en 1637. La idea fundamental de la geometría 
analítica es la introducción de «coordenadas»; esto es, de números li- 
gados o coordinados con un objeto geométrico y que caracterizan com- 
pletamente a éste. La mayor parte de los lectores conocen, sin duda, 
las llamadas coordenadas cartesianas rectangulares, que sirven para 
caracterizar la posición de un punto P en un plano. Se parte de dos 
rectas fijas perpendiculares del plano, el «eje x» y el «eje y», a las que 
se refiere todo punto. Estas rectas se: consideran como rectas numéri- 


1 El lector que no conozca suficientemente esta materia encontrará en el Apéndice 
del final del libro una serie de ejercicios sobre los elementos de geometría analítica. 
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cas orientadas, y se miden con la misma unidad. A cada punto P 
(Fig. 12) se le asignan dos coordenadas x e y. Estos números se obtie- 
nen de la siguiente forma: consideremos el segmento dirigido desde el 
«origen» O al punto P, y proyectemos este segmento orientado, que 
a veces se llama «vector de posición» de P, perpendicularmente sobre 





FIG. 12.—Coordenadas rectangulares +» FiG. 13.—Los cuatro cuadrantes, 
de un punto. 


los dos ejes; de este modo se obtiene el segmento orientado OP” sobre 
el eje x, con el número x como medida desu longitud orientada a 
partir de O, y del mismo modo el segmento orientado OQ” sobre el 
eje y, con el número y como medida 
de su longitud orientada a partir 
de O. Los dos números x, y son las 
coordenadas de P. Recíprocamente: 
si x, y son dos números arbitrarios 
dados, el punto P correspondiente 
está univocamente determinado. Si 
x, y son los dos positivos, P está 
en el primer cuadrante del sistema 
de coordenadas (Fig. 13); si los dos 
son negativos, P está en el tercer 
Frc. 14.—Distancia entre dos puntos, Cuadrante; si x es positivo e y ne- 
gativo, P estará en el cuarto cua- 
drante y, finalmente, si z es negativo e y positivo, P se hallará en 
el segundo cuadrante. 
La distancia entre el punto Py, de coordenadas zx, y1, y el punto 
P2, de coordenadas zə, Y2, Viene dada por la fórmula 





d2? = (22 — 11)? + (ya — y1)?, 11] 
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la cual se obtiene inmediatamente por el teorema de Pitágoras, «como 
resulta de la figura 14. 

*2, Ecuaciones de rectas y curvas.—-Si C es un punto fijo de coor- 
denadas x = a, y = b, el lugar de todos los puntos P que están a una 
distancia.r dada de C es una circunferencia con centro C y radio r. 
De la fórmula [1], que da la distancia entre dos puntos, resulta que 
los puntos de dicha circunferencia tienen coordenadas x, y que satis- 
facen la ecuación 


(a — a)? + (y — b)? = rè. 12) 


Ésta es la llamada ecuación de la circunferencia, ya que expresa la 
condición completa (necesaria y suficiente) 
que han de: cumplir las coordenadas zx, y 
de un punto P para estar sobre la circun- 
ferencia de centro C y radio r. Si se des- 
arrollan los paréntesis de [2], dicha ecua- 
ción toma la forma 


x2 + y? — 2ax — 2by = k, [3] 


donde k = r? — a2 — b?, Reciprocamente: si 
se tiene una ecuación de la forma [3],  Fi.15.--La circunferencia. 
siendo a, b y k constantes arbitrarias tales 
que k +a? + b2 es positivo, mediante el proceso algebraico' de 
«completar: los cuadrados», podemos escribir la. ecuación en la forma 


(æ — a)? + (y — b)? = r?, 


dende es r? = k +0? + $. Resulta, en consecuencia, que la ecua- 
ción [3] define una circunferencia de radio r, que tiene su centro en 
el punto G de coordenadas a y b. 

Las ecuaciones de las rectas tienen una forma todavia más sencilla; 
p. ej., el eje x tiene como ecuación y = 0, puesto que y = 0 se verifica 
para todos los puntos del eje x y sólo para ellos. El eje y tiene la 
ecuación x = 0. Las rectas que pasan por el origen y bisecan los ángu- 
los formados por los ejes tienen como ecuaciones x = y y £t = —Y. 
Es fácil probar que toda recta tiene una ecuación de la forma 


ax + by = c, 14] 


donde a, b y c son constantes que caracterizan la recta. La significa- 
ción de la ecuación [4] es la de que todos los pares de valores x, y que la 
satisfacen son coordenadas de puntos de la recta, y recíprocamente. 
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Es posible que el lector sepa que la ecuación 


3 2 
Ttar! [5] 
representa una elipse (Fig. 16). Esta curva corta al eje x en los puntos 
A(p, 0) y A'(—p, 0), y al eje y en B(0, q) y B'(0, —q). (Usaremos la 
notación P(x, y) o simplemente (x, y) para designar brevemente «el 
punto P con coordenadas x, y».) Si es p > q, el segmento AA”, de 
longitud 2p, se llama eje mayor de la elipse, mientras que el segmen- 
to BB', de longitud 2q, se llama eje menor. La elipse es el lugar de 
todos los puntos P cuya suma de distancia a los puntos F(yp1—q*, 0) 








y 
Xx 
Fic. 16.—La elipse; F y F’ Fig. 17.--La hipérbola; F y F’ 
son los focos. son los focos. 


y F(—vVp*-q? 0) es 2p. El lector puede comprobar esto, como 
ejercicio, utilizando la fórmula [1]. Los puntos F y F’ se llaman 

23— gn? 
focos de la elipse, y el cociente e = vere se denomina excentrici- 
dad de la misma. 


Una ecuación de la forma 


2 2 
representa una hipérbola. Esta curva (Fig. 17) está formada por dos 
ramas que cortan al eje x en los puntos A(p, 0) y A'(—p, 0), respecti- 
vamente. El segmento AA’, de longitud 2p, se llama eje transversal 
de la hipérbola. La hipérbola se aproxima indefinidamente a las dos 
rectas qx + py = 0 a medida que se aleja del origen, sin llegar nun- 
ca a tocarlas; dichas rectas se llaman asíntotas de la hipérbola. La 
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hipérbola es el lugar de todos los puntos P cuya Heci de distan- 





cias a los dos puntos F(yp*+ g’, 0) y F'(—vVpYF q, 0) es 2p. 
Estos dos puntos se llaman focos de la hipérbola; la excentricidad de 
VP+ g 


la curva viene dada por el cociente e = 


La ecuación 
ty = 1 [7] 


define también una hipérbola cuyas asíntotas son los ejes coordena- 
dos (Fig. 18). La ecuación de esta hipérbola «equilátera» indica que 
el área del rectángulo determinado 
por P y los ejes (Fig. 18) es igual a y 
1 para todo punto P de la curva. 

Una hipérbola equilátera cuya 
ecuación sea 


xy =C, [7a) z 


siendo. c una constante, es sólo un 
caso particular de hipérbola, del mis- 
mo modo que la circunferencia es un 
caso, particular de la elipse. La par- 
ticularidad de la hipérbola equilátera 5j. 18.—La hipérbola equilátera 


reside en el hecho de que sus asínto- zy = 1. El área zy del rectángulo 
3 Pienninads por el punto P (z, y) . 
tas (en el caso presente, los ejes) son es igual a 1. 


perpendiculares entre sí. 

Para nosotros, la cuestión fundamental es ła idea de que los obje- 
tos geométricos pueden ser representados de modo completo mediante 
elementos aritméticos y algébricos, y que lo mismo sucede con las 
operaciones geométricas; p. ej., si queremos determinar el punto de 
intersección de dos rectas, consideraremos las dos ecuaciones 


ar + by =c 
[8] 

ar +by=<. 
El punto común a las rectas se hallará determinando sus coordenadas, 
que no son otra cosa que la solución z, y del sistema [8]. Análoga- 
mente, los puntos de intersección de dos líneas, tales como la circun- 
ferencia 22 + y? — 2ar — 2by = k y la recta ar + by = c, se hallarían 
resolviendo el sistema formado por las ecuaciones de ambas líneas. 
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1v. ANÁLISIS DEL CONCEPTO MATEMÁTICO DE INFINITUD 
1. Conceptos fundamentales.—La sucesión de los enteros positivos 
112,3, ... 


es el primer y mas importante ejemplo de conjunto infinito. No hay 
ningún misterio en el hecho de que esta sucesión no tiene fin; puesto 
que, por grande que sea el entero n, siempre se puede formar el en- 
tero siguiente n + 1. Pero el paso del adjetivo «infinito», que significa 
simplemente «sin fin», al sustantivo «infinito» no debe hacernos pensar 
que «infinito», representado generalmente con el símbolo co, puede 
considerarse como si fuera un número ordinario. No es posible incluir 
el símbolo co en el sistema de los números reales y conservar al mismo 
tiempo las leyes fundamentales de la aritmética. Sin embargo, el con- 
cepto de infinito invade toda la matemática, ya que los objetos ma- 
temáticos son considerados habitualmente, no como individuos, sino 
como miembros de clases o conjuntos que contienen una infinidad de 
objetos del mismo tipo, tales corno el conjunto de todos los enteros, 
o el de los números reales, o él de los triángulos de un plano. Por esta 
razón es necesario analizar el infinito matemático de una manera pre- 
cisa: La teoría moderna de conjúntos, creada por Georg Cantor y su 
éschela a fines del siglo pasado, obtuvo brillantes resultados en tal 
cometido. La teoría de conjuntos de Cantor ha penetrado y ejercido 
enorme influjo en varios campos de la matemática, y ha llegado a ser 
de importancia fundamental en el estudio de las bases lógicas y filo- 
sóficas de dicha ciencia. El punto de partida es el concepto general de 
conjunto o agregado. En este concépto se comprende toda colección 
de objetos definida por una regla determinada que especifica exacta- 
mente qué objetos pertenecen a la colección. Como ejemplos podemos 
considerar el conjunto de todos los enteros positivos; el de todos los 
decimales periódicos; el conjunto de todos los números reales, o el de 
todas las rectas del espacio de tres dimensiones. 

Para comparar la «magnitud» de dos conjuntos diferentes es fun- 
damental la noción de «equivalencia». Si los elementos de dos conjun- 
tos A y B pueden ser apareados, de modo que a todo elemento de A 
corresponda un elemento (y sólo uno) de B y a cada elemento de B 
corresponda un elemento de A, y uno solo, la correspondencia entre 
A y B se llama biunívoca, y dichos conjuntos se dicen equivalentes o 
coordinables, La noción de equivalencia para conjuntos finitos coincide 
con la noción ordinaria de igualdad de números, puesto que dos con- 
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juntos finitos tienen el mismo número de elementos cuando (y sólo 
entonces) se pueden poner en correspondencia biunívoca. Ésta es, en 
realidad, la verdadera idea que interviene en la operación de contar, 
ya que cuando contamos un conjunto finito de objetos lo que hace- 
mos es establecer una correspondencia biunívoca entre dichos obje- 
tos y el conjunto de símbolos numéricos 1, 2, 3, ... „n. 


No es necesario siempre contar los objetos de dos conjuntos finitos para com- 
probar su equivalencia; p. ej., se puede afirmar, sin necesidad de contar, que 
todo conjunto finito de circunferencia de radio 1 es coordinable con el conjunto 
de sus centros. 


La idea de Cantor fué la de extender el concepto de equivalencia a 
los conjuntos infinitos para poder de este modo definir una «aritmé- 
tica» de los infinitos. El conjunto de todos los números reales y el 
conjunto de todos los puntos de una recta son equivalentes, puesto 
que la elección del origen y del segmento unidad permite asociar de 
modo biunívoco cada punto P de la recta con un número real x de- 
terminado, su abscisa: 


P <> x. 


Los enteros pares forman un subconjunto propio del conjunto de 
todos los enteros, y los enteros forman un subconjunto propio del con- 
junto de todos los números racionales. (Con la frase subconjunto propio 
de un conjunto S designamos un conjunto S’ formado por algunos, 
no todos, de los objetos de S). Evidentemente, si un conjunto es finito, 
es decir, si contiene un cierto número n de elementos, no puede ser 
equivalente a ninguno de sus subconjuntos propios, ya que cualquier 
subconjunto puede contener a lo sumo n—1. elementos. En cambio, 
si un conjunto contiene infinitos objetos se verifica, lo que a primera 
vista parece paradójico, que es equivalente a algunos de sus subconjun- 
tos propios; p. ej., la coordinación 


IL 


establece una correspondencia biunívoca entre el conjunto de los enteros 
positivos y su subconjunto propio formado por los enteros pares, y, por 
tanto, ambos conjuntos son equivalentes. Esta contradicción con el 
familiar axioma «el todo es mayor que cualquiera de sus partes» mues- 
tra qué sorpresas pueden presentarse en el dominio del infinito. 

2. La numerabilidad de los números racionales y la no-numerabi- 
lidad del continuo.—Uno de los primeros descubrimientos de Cantor 
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en su análisis del infinito fué el de que el conjunto de los números ra- 
cionales (que contiene el conjunto infinito de los enteros y que, por 
consiguiente, es infinito) es equivalente al conjunto de los enteros. A pri- 
mera vista resulta bastante extraño que el conjunto denso en la recta 
de los números racionales pueda ser equivalente al disperso conjunto 
de los enteros. Ciertamente, no se pueden colocar los números positivos 
racionales en orden de magnitud (como ocurre con los enteros), de modo 
que haya un a que sea el primer número racional, b el inmediato ma- 
yor, y así sucesivamente, puesto que existen infinitos números racio- 
nales entre dos cualesquiera dados, y, por consiguiente, carece de senti- 
do la expresión «el inmediato mayor». Pero, como observó Cantor, 
prescindiendo de la relación de magnitud entre los elementos consecu- 
tivos, es posible colocar los números racionales en una sucesión r, T2, 
T3, ..., análoga a la de los enteros. En dicha sucesión habrá un primer 
número racional, un segundo, un tercero y así sucesivamente, y todo 
número racional aparecerá precisamente una vez. Una ordenación de 
los elementos de un conjunto en una sucesión análoga a la de los 
enteros se llamá una enumeración del conjunto. Construyendo una 
enumeración del conjunto de los números racionales, Cantor probó 
que dicho conjunto es equivalente al de los números enteros, ya que 
la correspondencia 


1 2 3 4...n. 
ai: 
Ti ra T3 Tå . n 


es biunívoca. Vamos a describir una manera efectiva de enumeración 
de los números racionales. 

Todo número racional puede escribirse en la forma ajb, donde a y b 
son enteros, y todos aquellos números pueden disponerse en un cua- 
dro, con ajb en la fila a y en la columna b; p. ej., 3/4 estará en la ter- ' 
cera fila y en la cuarta columna. Entonces, todos los números racionales 
positivos pueden ser ordenados según el esquema siguiente: en el cua- 
dro anterior trazamos una línea quebrada continua que pase por todos 
los números del cuadro en la forma indicada en la figura 19. Partiendo 
del 1, vamos horizontalmente hasta el primer lugar a la derecha, ob- 
teniendo el 2: como segundo término de la sucesión; vamos. entonces 
diagonalmente hacia abajo, a la izquierda, hasta la primera columna, 
a alcanzar la posición ocupada por el 1/2; luego, verticalmente, hacia 
abajo, un lugar, hasta el 1/3; después, diagonalmente hacia arriba y a 
la derecha, alcanzamos el 3: de ahí pasamos al 4 y después, diagonal- 
mente, hasta el 1/4, y así sucesivamente. A través de esta línea que- 
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brada se obtiene la sucesión 1, 2, 1/2, 1/3, 2/2, 3, 4, 3/2, 2/3, 1/4, 1/5, 
2/4, 3/3, 4/2, 5. ... que contiene los números racionales en el orden en 
que aparecen en la línea quebrada. En dicha sucesión suprimimos 
aquellos números .a/b para los cuales a y b tienen un factor común, 
de modo que cada número racional aparezca una sola vez, represen- 
tado por una fracción irreducible. Se obtiene así la sucesión 


¿21234567 +... 





1434341402 i 
13444940 i 
11444212. 
111414. 
tiiti 


Loro. .«..«..u:0u0:.:...%.(.4.0u.(w.w0.0:00 e. e o e 


FG, 19,—El conjunto de los números racionales es numerable, 


1, 2, 1/2, 1/3, 3, 4, 3/2, 2/3, 1/4, 1/5, 5, ... la cual contiene cada nú- 
mero racional una sola vez. Resulta así la numerabilidad del conjunto 
de los números racionales. Como consecuencia de la correspondencia 
biunívoca entre los números racionales y los puntos racionales de una 
recta, se tiene la numerabilidad del conjunto de los puntos racionales 
de la recta. 


Ejercicios: 

1. Pruébese que el conjunto de todos los enteros positivos y negativos es 
numerable. Pruébese que el conjunto de los números racionales positivos y nega- 
tivos es numerable. 

2. Pruébese que el conjunto S + T (véase pág. 120) es numerable si S y T 
son numerables, Pruébese el mismo hecho para el caso de una suma de tres, cua- 
tro o cualquier número n de conjuntos, y, finalmente, para un conjunto nume- 
rable de conjuntos numerables. 


Habiendo demostrado que el conjunto de números racionales es 
numerable, podría esperarse que todo conjunto infinito fuera también 
numerable, con lo que se tendría el resultado final del análisis del infi- 
nito. La realidad de los hechos es muy distinta. El mismo Cantor 
obtuvo el notable resultado de que el conjunto de los números reales, 
racionales e irracionales, no es numerable. En otros términos, el con- 
junto de los números reales presenta una diferencia radical y, por así 
decirlo, un tipo superior de infinitud que el de los enteros o el de los 
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números racionales. La ingeniosa demostración indirecta de este hecho, 
debida a Cantor, ha quedado como modelo para un cierto tipo .de 
demostraciones matemáticas. Las líneas principales de dicha demos- 
tración son las siguientes: se parte de la hipótesis de que todos los 
números reales pueden ser efectivamente enumerados y dispuestos en 
una sucesión, y se construye luego un número real que no figura en 
dicha sucesión. De ahí resulta una contradicción con la hipótesis ini- 
cial, que suponía que todos los números reales estaban incluídos en la 
sucesión; la hipótesis de que la enumeración de los números reales es 
posible resulta absurda y, en consecuencia, la hipótesis contraria, es 
decir, la proposición de Cantor de que el conjunto de los números 
reales no es numerable queda demostrada. 

Para llevar a cabo el programa indicado, supongamos que hemos 
enumerado todos los números reales colocándolos en una tabla de 
decimales infinitos 


1.* número Nj,ajazazaQ4a5 -.. 

2. número  Na,bibabzbabs -- - 

3.*r número Ng,cicac3CaC5 »-- 
donde las N designan la parte entera y las letras minúsculas las cifras 
decimales. Supongamos que esta sucesión de fracciones decimales con- 
tiene todos los números reales, El punto esencial de la demostración 
consiste en construir, por un «proceso diagonal», un número del que 
se demuestra que no puede estar en la sucesión. Para ello, comencemos 
por elegir una cifra a distinta de a, y de O y 9 (las últimas exigencias 
se hacen para evitar ambigúedades que puedan resultar de igualdades 
análogas a la 0,9999 ... = 1,0000 ...); luego, una cifra b distinta de ba, 
de 0 y de 9; después, una c diferente de cz, de O y de 9, y así sucesiva- 
mente. (P. ej., se puede elegir a = 1, a no ser que sea a; = 1, en cuyo 
caso tomaríamos a = 2, y análogamente para las cifras b, €, d, €, ....) 
Consideremos entonces el decimal infinito 


z = 0,abcde : 


Este nuevo número z es ciertamente distinto de cualquiera de lós que 
están en la tabla anterior; no puede ser igual al primero, puesto que 
difiere de él en la primera cifra decimal; no puede ser igual al segundo, 
porque tiene distinta la segunda cifra decimal; y, en general, no puede 
. ser igual al que ocupa el lugar n, porque difiere de él en la n-ésima 
cifra decimal. Esto prueba que dicha tabla, en la que hemos dispuesto 
una sucesión de números reales, no puede contener todos los números 
reales. El conjunto de estos números no es, por tanto, numerable. 
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Quizá pueda sospechar el lector que la razón de la no-numerabili- 
dad del continuo numérico esté en el hecho de que la recta se extiende 
infinitamente, y que posiblemente pueda ser numerable el conjunto 
de los puntos de un segmento finito de recta. Se comprueba fácil- 
mente que no es éste el caso viendo que el continuo numérico es equiva- 
lente a cualquier segmento finito; p. ej., al (0,1), del que se han ex- 
cluído los extremos. La correspondencia biunívoca deseada se puede 
obtener formando con dicho segmento una quebrada de tres lados de 





Fic. 20.—Correspondencia biunívoca entre los puntos F1G. 21.—Correspondencia 
de una poligonal y los de la recta completa, biunivoca entre los pun- 
j ; tos de dos segmentos de 

distinta longitud. 


longitud igual a 1/3 y proyectando desde un punto conveniente, como se 
indica en la figura 20. Resulta, por tanto, que también un segmento fini- 
to de la reçta numérica contiene una infinidad no-numerable de puntos. 


Ejercicio: Pruébese que cualquier intervalo [A, B] de la recta numérica es 
equivalente a otro intervalo cualquiera [C, D]. 


Vale la pena indicar otra demostración, quizá más intuitiva, de la 
no-numerabilidad del continuo numérico. Apoyándonos en lo que aca- 
bamos de decir, será suficiente que nos ocupemos del conjunto de 
puntos comprendidos entre 0 y 1. La nueva demostración será tam- 
bién por reducción al absurdo. Supongamos que el conjunto de todos 
los puntos de la recta comprendidos entre O y 1 puede ser ordenado 
en una sucesión 


a1, A2, Ag," "". [1] 


Incluyamos el punto a, en un intervalo de longitud 1/10, el punto az 
en un intervalo de longitud 1/102, y así sucesivamente. Si todos los 
puntos del intervalo (0,1) estuvieran en la sucesión [1], el intervalo 
unidad aparecería completamente recubierto, en parte quizá por inter- 
valos superpuestos, por la sucesión de intervalos de longitudes 1/10, 
1/102, ... que hemos construído. (El hecho de que alguno de los inter- 
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valos pueda extenderse fuera del segmento. unidad no influye en la 

aemostración./ Ca suma de (as fongitudes de dichos intervalos viene 
dada por la serie geométrica 

: 1 1 1 

1/10 + 1/102 + 1/108 +... = — |——|= 

AEEY RY + 10 | 1 | 


y A 


Así, la hipótesis de que la sucesión [1] contiene todos los números 
reales comprendidos entre O y 1 que llenan el intervalo completo de 
longitud 1 conduce a la contradicción de que dicho intervalo puede 
ser recubierto por un conjunto de intervalos de longitud total igual 
a 1/9, lo cual es intuitivamente absurdo. Aceptaremos esta contradic- 
ción como una demostración, aunque desde un punto de vista lógico 
requeriría un análisis más detallado. 


El razonamiento del párrafo anterior sirve para establecer un teorema de gran 
importancia en la teoría moderna de la medida. Reemplazando los intervalos 
anteriores por otros más pequeños de longitud e/10n, donde e es un “número posi- 
tivo arbitrariamente pequeño, se ve que los puntos de todo conjunto númerable 
de la: recta pueden ser incluídos en un conjunto de intervalos de longitud total 
igual a e/9. Puesto que. e es arbitrario, dicha longitud total puede ser tan pe- 
. queña como se quiera. En la terminología de la teorfa de la medida expresaremos 
este hecho diciendo que un conjunto numerable de puntos tiene medida nula. 

Ejercicio: Demuéstrese que el mismo resultado tiene lugar para un conjunto 
numerable de: puntos de un plano, reemplazando las longitudes de los intervalos 
por áreas de cuadrados. 


3. «Números cardinales» de Cantor.—Resumiendo los resultados 
expuestos hasta ahora, se tiene: el número de elementos de un con- 
junto finito A no puede ser igual al número de elementos de un con- 
junto finito B, si A contiene más elementos que B. Si reemplazamos 
el concepto de «conjuntos con el mismo número (finito) de elementos» 
por el concepto más general de conjuntos equivalentes, se tiene que para 
conjuntos infinitos no es válida la proposición anterior; el conjunto de 
todos los enteros contiene más elementos que el conjunto de los nú- 
meros pares, y el conjunto de los números racionales más que el de 
enteros y, sin embargo, estos tres conjuntos son equivalentes. Esto 
podría hacer sospechar que todos los conjuntos infinitos fueran equi- 
valentes y que toda otra distinción que la de conjuntos finitos e infi- 
nitos resultaría superflua; pero hemos visto. que los resultados de 
Cantor contradicen tal sospecha; existe un conjunto, el continuo nu- 
mérico real, que no es equivalente a ningún conjunto numerable. 

Así resulta que hay al menos dos tipos diferentes de «infinitud»: 
el infinito numerable de los enteros y el infinito no-numerable del con- 
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tinuo. Si dos conjuntos, finitos o infinitos, son equivalentes, diremos 
que tienen el mismo número cardinal. Esta propiedad se reduce a la 
noción ordinaria de igual número natural si A y B son finitos, y puede 
considerarse como una generalización de este concepto. Por otra parte, 
si un conjunto A es equivalente con algún subconjunto de B, mientras 
que B no es equivalente con A ni con ninguno de sus subconjuntos, 
diremos, siguiendo a Cantor, que el conjunto B tiene un número car- 
dinal mayor que el del conjunto A. El uso de la palabra «número» 
está también en este caso de acuerdo con la noción de «número mayor» 
para conjuntos finitos. El conjunto de los enteros es un subconjunto 
del conjunto de los números reales, mientras que el conjunto de los 
números reales no es equivalente con el de los enteros ni con ninguno 
de los subconjuntos de éste (es decir, el conjunto de los números rea- 
les no es numerable ni finito); por tanto, dé acuerdo con nuestra de- 
finición, el continuo de los números reales tiene un número cardinal 
mayor que el conjunto de los enteros. 


*Se debe indicar que Cantor demostró realmente cómo construir una sucesión 
de conjuntos infinitos de números cardinales crecientes. Partiendo de los números 
enteros positivos, es suficiente probar que dado un conjunto A cualquiera, es posible 
construir otro conjunto B de mayor número cardinal que aquél. A causa de la gran gene- 
ralidad de este teorema su demostración resulta bastante abstracta. Definimos el 
conjunto B como el conjunto de todos los distintos subconjuntos de A. En el término 
«subconjunto» debemos incluir no solamente los subconjuntos propios de A, sino 
también A mismo y el «subconjunto vacío», 0, que no contiene ningún elemento. 
(Así, en el caso en que A esté formado por los enteros 1, 2, 3, B consta de los 8 
elementos diferentes { 1, 2, 3), (1,2), (1,33, {2,3}, {1}, (2), 13) y 0.) Los 
elementos de B son a su vez conjuntos formados por elementos de A. Supongamos 
que B es equivalente a A o a algún subconjunto de A; es decir, que existe una ley 
que coordina de manera biunívoca los elementos de A o de uno de sus subcon- 
juntos con todos los elementos de B; esto es, con los subconjuntos de A: 


a > Sa , ` {2} 


donde designamos con Sa el subconjunto de A que corresponde al elemento a de A. 
Llegaremos a una contradicción construyendo un elemento de B (es decir, un 
subconjunto de A) al que no le corresponde ningún elemento a de A. En la cons- 
trucción de este subconjunto se observa que existen dos posibilidades para todo 
elemento x de A: o bien el conjunto Sx asignado a x por la correspondencia [2] 
contiene al elemento x, o Sx no contiene a x. Definamos T como el subconjunto de A 
formado por los elementos x tales que Sx no contiene a x. Este subconjunto T difiere 
de cualquier Sa al menos en el elemento a, puesto que si Sa contiene a a, T no 
debe contenerlo, mientras que si S¿ no contiene a a, T debe contenerlo. En con- 
secuencia, T no está incluído en la correspondencia [2]. Esto prueba que no se 
puede establecer una correspondencia biunívoca entre los elementos de A, o de un 
subconjunto de A, y los de B. Sin embargo, la coordinación 


a 4> {a} 


COURANT. —5 
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define una correspondencia biunívoca entre los elementos de A y el subconjunto 
de B formado por los subconjuntos de A que constan de un solo elemento. En 
consecuencia, de acuerdo con la definición del último párrafo, B tiene un número 
cardinal mayor que el de A. 

*Ejercicio: Si A contiene n elementos, siendo n un entero positivo, pruébese 
que B, tal como ha sido definido antes, contiene 27 elementos. Si A es el conjunto 
de todos.los enteros positivos, demuéstrese que B es equivalente al continuo nu- 
mérico entre 0 y 1. (Indicación: Represéntese todo subconjunto de A en el pri- 
mer caso por una sucesión finita y en el segundo por una sucesión infinita de las 
cifras 0 y 1, 

ajagaz" st 


siendo an = 1 ó 0, según que el n-ésimo elemento de A pertenezca o no al sub- 
conjunto en cuestión.) 

Podría pensarse que es fácil encontrar un conjunto de puntos con número car- 
dinal mayor que el conjunto de los números reales entre 0 y 1, Puesto que, a pri- 
mera vista, un cuadrado, siendo de «dimensión 2», parece contener «más» puntos 
que un segmento «unidimensional». Paradójicamente, las cosas no ocurren de ese 
modo: el número cardinal del conjunto de puntos de un cuadrado es el mismo que 
el del conjunto de puntos de un segmento. Para probar esta afirmación, establecere- 
mos la correspondencia siguiente: 

Si (x, y) es un punto de un cuadrado de lado unidad, x e y pueden ser escritos 
en forma decimal 

x = 0,ajagagas::*, 
y = 0,bibabsba t>, 


donde para evitar ambigüedades escribiremos, p. ej., 0,250000... en, vez de 
0,249999 - - para el número racional 1/4. Al punto (x, y) del cuadrado le hace- 
mos corresponder el punto 


-z = 0,a1b1a2b243b304b14' ° 


del segmento entre 0 y 1. Evidentemente, a puntos distintos (x, y) y (1', y”) del 
cuadrado les corresponderán puntos distintos z y z’ del segmento, de modo que 
el número cardinal del cuadrado no puede exceder del cardinal del segmento. 

(En realidad, la correspondencia que acabamos de establecer es biunívoca 
entre el conjunto de todos los puntos del cuadrado y un subconjunto propio del 
segmento unidad; puesto que ningún punto del cuadrado corresponde al punto 
0,21409090909 : - - del segmento, ya que, como hemos indicado, tomamos la forma 
0,250000: - - y no la 0,2499999: -> para representar el número 1/4. Sin embargo, 
es posible modificar un poco la correspondencia, de modo que se tenga la biuni- 
vocidad entre el cuadrado y el segmento, los cuales resultan así con el mismo 
número cardinal.) 

Un razonamiento análogo al anterior mostraría que el número cardinal de los 
puntos de un cubo es igual al número cardinal del segmento unidad. 

Aunque estos resultados parecen contradecir la noción intuitiva de dimensión, 
debemos recordar que la correspondencia que hemos definido no es «continua»; si 
recorremos el segmento de 0 a 1 de modo continuo, los puntos correspondientes 
del cuadrado no forman una curva continua, sino que aparecen en un orden com- 
pletamente caótico. La dimensión de un conjunto de puntos depende, no sola- 
mente del número cardinal del conjunto, sino también del modo como los puntos 
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aparecen distribuidos en el espacio. En el capítulo V volveremos a' ocuparnos de 
esta cuestión. 

4. El método de demostración indirecta (demostraciones por re- 
ducción al absurdo).—La teoría de los números cardinales no es más 
que un aspecto de la teoría general de conjuntos, creada por Cantor 
en lucha con las severas críticas de algunos de los más distinguidos 
matemáticos de su tiempo. Algunos de estos críticos, tales como Kro- 
necker y Poincaré, le reprochaban la vaguedad del concepto general 
de «conjunto» y el carácter no constructivo de los razonamientos utili- 
zados para definir algunos conjuntos. 

Las objeciones a los razonamientos no constructivos se refieren a 
las que podemos llamar pruebas indirectas o demostraciones por reduc- 
ción al absurdo. Las demostraciones indirectas constituyen un tipo ha- 
bitual de razonamiento matemático: para establecer la verdad de una 
proposición A, se hace la hipótesis de que la proposición A”, contra- 
ria de la A, es cierta. Entonces, mediante una cadena de razonamien- 
tos, se llega a una contradicción con A”, lo que prueba lo absurdo 
de A”. En consecuencia, apoyándose en el principio lógico fundanten- 
tal del tertio excluso, la falsedad de A” establece la verdad de A. 

A lo largo de este libro encontraremos ejemplos de demostraciones 
indirectas que pueden convertirse en demostraciones directas, si bien 
la forma indirecta presenta las ventajas de la brevedad y de prescindir 
de detalles que no son necesarios para el objetivo inmediato. Existen, 
sin embargo, teoremas para los cuales no ha sido posible dar más 
demostración que la indirecta; aún más: hay teoremas que se pueden 
demostrar por el método indirecto, para los cuales no sería posible. ni 
siquiera en principio dar una demostración directa constructiva, a 
causa de la naturaleza misma del teorema. Tal es, p. ej., el teorema 
dado en la página 90. En distintas ocasiones de la historia de las ma- 
temáticas, en las que los esfuerzos de los matemáticos se dirigían 
hacia la obtención de soluciones constructivas para determinados pro- 
blemas, con vistas a mostrar la posibilidad de solución, se llegó a la 
construcción gracias a haberse encontrado una demostración indi- 
recta y no constructiva. 

Existe una diferencia esencial entre probar la existencia de un ob- 
jeto de cierto tipo mediante la construcción de un ejemplo tangible 
de tal objeto y demostrar que la no existencia de dicho objeto 
conduciría a una contradicción. En el primer caso se tiene un obje- 
to tangible, mientras que en el segundo no se tiene más que una con- 
tradicción. Algunos matemáticos destacados han propugnado en tiem- 
pos recientes la supresión más o menos completa de las demostraciones 
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no constructivas de la matemática. Aun en el caso en que se considere 
deseable este programa, en el estado actual de la matemática supon- 
dría una gran complicación y también la parcial destrucción del edificio 
matemático actual. Por esta razón no es de extrañar que la escuela 
«intuicionista», que es la que ha adoptado tal programa, haya encon- 
trado fuerte resistencia, y que los intuicionistas más puros no puedan 
en ocasiones permanecer fieles a sus principios. 

5. Las paradojas del infinito.—Aunque la posición irreducible de 
los intuicionistas parece demasiado extremista a la mayor parte de los 
matemáticos, la aparición de paradojas lógicas en la teoría de los con- 
juntos infinitos representó una seria amenaza para dicha teoría. Pronto 
se observó que la utilización sin restricciones del concepto de «conjunto» 
podía conducir a contradicciones. Una de las paradojas, presentada 
por Bertrand Russell, puede ser formulada como sigue: la mayor parte 
delos conjuntos no se contienen a sí mismos como elementos; p. ej., el 
conjunto A de los números enteros contiene como elementos única- 
mente números enteros; como A no es un entero, sino un conjunto de 
enteros, no se contiene a sí mismo como elemento. Un conjunto de 
este tipo se llamará «ordinario». Sin embargo, es posible que un con- 
junto se contenga a sí mismo como elemento; p. ej., el conjunto S, de- 
finido por la frase «S contiene como elementos los conjuntos que se 
pueden definir en castellano con una frase de menos de treinta pala- 
bras», es un conjunto que se contiene a sí mismo como elemento. A es- 
tos conjuntos los llamaremos «extraordinarios». En todo caso, la mayor 
parte de los conjuntos son ordinarios y podemos excluir el comporta- 
miento extraño de los conjuntos «extraordinarios», limitando nuestra 
atención al conjunto de todos los conjuntos ordinarios. Llamemos C a 
dicho conjunto. Cualquier elemento de C es a su vez un conjunto; en 
realidad un conjunto ordinario. Ahora se plantea la cuestión de saber 
si el conjunto C es ordinario o extraordinario. Debe ser de uno o del 
otro tipo; si C es ordinario, debe contenerse a sí mismo como elemento, 
puesto. que hemos definido C por la propiedad de contener a todos los 
conjuntos ordinarios; pero si es así, C debe ser extraordinario, ya que 
hemos llamado extraordinarios a los conjuntos que se contienen a sí 
mismos como elementos. Se tiene en consecuencia una contradicción; 
por tanto, C debe ser extraordinario. Pero entonces C, que se contiene 
a sí mismo por ser extraordinario, contendrá un conjunto extraordina- 
rio (el mismo C), en contradicción con la definición que dimos de C 
como conjunto que contiene únicamente conjuntos ordinarios. Vemos 
así que, en cualquiera de las dos hipótesis, la mera existencia de C 
conduce a una contradicción. 
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6. Los fundamentos de la matemática.—Paradojas análogas a la 
precedente condujeron a Russell y a otros matemáticos a un estudio 
sistemático de los fundamentos de la matemática y de la lógica. El 
objeto final de sus esfuerzos es el de dar al razonamiento matemático 
una base lógica, la cual se pueda probar que está libre de contradic- 
ción, y que al mismo tiempo incluya todo lo que es considerado como 
importante por todos (o algunos de) los matemáticos. Aunque esta 
meta ambiciosa no ha sido alcanzada y quizá no pueda ser alcanzada 
nunca, el tema de la lógica matemática ha atraído la atención de un 
número creciente de estudiosos. Muchas de las cuestiones en este do- 
minio que pueden ser enunciadas en forma simple presentan grandes 
dificultades para su solución. Como ejemplo, citaremos la llamada hi- 
pótesis del continuo, que supone la no existencia de ningún conjunto 
cuyo número cardinal sea mayor que el de los conjuntos numerables y 
menor que el del continuo numérico correspondiente al conjunto de los 
números reales. De esta hipótesis pueden deducirse muchas consecuen- 
cias interesantes; pero hasta ahora no ha sido demostrada ni refutada, 
si bien recientemente Kurt Gódel ha probado que si el sistema de pos- 
tulados sobre los que se funda la teoría de conjuntos no es contradicto- 
rio, tampoco lo es el sistema ampliado obtenido al añadir la hipótesis 
del continuo. Cuestiones tales como éstas se reducen en última instan- 
cia a saber lo que se quiere significar por el concepto de existencia ma- 
temática. Afortunadamente, la existencia de la matemática no depende 
de una respuesta satisfactoria. La escuela dé los «formalistas», dirigida 
por el gran matemático Hilbert, afirma que, en matemática, «existen- 
cia» significa simplemente «libre de contradicción». Resulta entonces 
necesario construir un sistema de postulados del que pueda deducirse 
toda la matemática por razonamiento puramente formal, y demostrar 
que este sistema de postulados no puede llevar nunca a contradicción. 
Los resultados recientes obtenidos por Gódel y otros parecen probar 
que este programa, al menos como fué concebido originalmente por 
Hilbert, no puede realizarse. Es significativo que la teoría de Hilbert 
acerca de la estructura formal de las matemáticas esté basada en esen- 
cia en un proceso intuitivo. De una forma u otra, explicita o implici- 
tamente, aun bajo el más inflexible aspecto formalista, lógico o pos- 
tulatorio, la intuición constructiva continúa siendo el elemento vital 
en matemáticas. 





V. NÚMEROS COMPLEJOS 


1. Origen de los números complejos.—Por muchas razones el con- 
cepto de número ha tenido que ser extendido más allá del continuo 
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numérico real mediante la introducción de los llamados números com- 
plejos. Debe observarse que en el desarrollo histórico y psicológico de 
las matemáticas, todas estas generalizaciones y nuevas invenciones no 
han sido en forma alguna resultado de algún esfuerzo individual, sino 
que más bien aparecen como el desenlace de una evolución gradual y 
cautelosa que no puede atribuirse a una sola persona determinada. 
Fué la necesidad de una mayor libertad en el cálculo formal lo que 
llevó a la utilización de los números racionales negativos, y sólo al 
final de la Edad Media empezaron los matemáticos a perder el temor 
de usar estos conceptos que no tenían el mismo carácter concreto e 
intuitivo de los números naturales. Hasta la mitad del siglo xix los 
matemáticos no percibieron de una forma completamente clara que 
la base esencial lógico-filosófica de las operaciones en un conjunto nu- 
mérico ampliado es formalista, y que las ampliaciones han de hacerse 
mediante definiciones que, como tales, son libres, pero resultan inúti- 
les si no son hechas de manera que las leyes y propiedades válidas en 
el campo numérico original se conserven al ampliar éste. El hecho de 
que estas ampliaciones puedan estar a veces relacionadas con objetos 
«reales», y que de esta forma procuren una herramienta para nuevas 
aplicaciones, es de la mayor importancia, si bien esto es sólo una 
justificación, pero no constituye una prueba lógica de la validez de 
la ampliación. 

El primer problema que requiere el uso de los números complejos 
es el de la resolución de las ecuaciones cuadráticas. Recordemos el con- 
cepto de ecuación lineal ax = b, en la cual hay que determinar la in- 


b 
cógnita x. La solución es simplemente z = nal la exigencia de que to- 


da ecuación de coeficientes enteros a 4 0 y b tenga solución, precisa 
de la introducción de los números racionales. Ecuaciones tales como 


z? = 2, (1) 


que carecen de solución en el campo de los números racionales, nos 
llevan a construir el campo más amplio de los números reales, en el 
cual existe solución. Pero incluso el campo de los números reales no 
es suficientemente amplio para procurarnos una teoría completa de 
las ecuaciones cuadráticas. Una ecuación sencilla tal como 


z2? = —1 [2) 


carece de solución real, pues el cuadrado de cualquier número real 
no es nunca negativo. 
Podemos contentarnos con la afirmación de que esta sencilla ecua- 
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ción no es resoluble, o bien seguir el camino usual de extender nuestro 
concepto de número mediante la introducción de números que permi- 
tan resolver la ecuación. Exactamente esto es lo que se hace al intro- 
ducir el nuevo símbolo i por la definición ¿2 = —1. Naturalmente, este 
objeto i, la «unidad imaginaria», no tiene nada que ver con el concepto 
de número tal como resulta de la operación de contar. Es puramente 
un símbolo, sometido a la regla fundamental i? = —1, y su valor de- 
penderá por completo de si mediante su introducción se ha conseguido 
una extensión del sistema numérico que resulte útil y manejable. 

Puesto que deseamos sumar y multiplicar con el símbolo í en igual 
forma que con los números reales ordinarios, deberemos ser capaces 
de formar símbolos tales como 2i, 31, —i, 2 + -5i o, más en general, 
a + bi, donde a y b son dos números reales cualesquiera. Si estos sím- 
bolos han de obedecer a las familiares leyes conmutativa, asociativa 
y distributiva de la suma y del producto, se tendrá, p. ej., 


Q+30+U1+40=Q+D+(B+4)i=3 HT, 
(2 + 3) (1 + 41) = 2 + 8i + 3i + 12i? = 
= (2 — 12) + (8 + 3) = —10 + 111, 


Guiados por estas consideraciones, comenzamos nuestra exposición 
sistemática haciendo la siguiente definición: llamaremos número com- 
plejo de parte real a y parte imaginaria b a un símbolo de la forma 
a + bi, donde a y b representan dos números reales cualesquiera. Con 
estos símbolos pueden realizarse las operaciones de adición y multi- 
plicación en igual forma que si í fuera un número real ordinario, sal- 
vo que ¿2 debe ser sustituido siempre por —1; con mayor precisión, de- 
finimos la adición y multiplicación. de números complejos mediante 
las reglas 


(a + bi) + (c + di) = (a + c) + (b + di, (3) 
(a + bi) (c + di) = (ac — bd) + (ad + be)i. 


En particular, se tiene: 


"(a+ bi) (a — bi) = a? — abi + abi — b?i? = a? + b?. 14] 


Mediante estas definiciones se comprueba fácilmente que subsisten 
para los números complejos las leyes conmutativa, asociativa y distri- 
butiva. Además, no solamente la adición y multiplicación, sino tam- 
bién la sustracción y división de dos números complejos, dan lugar a 
números de la forma a + bi, de modo que los números complejos for- 
man un cuerpo (véase pág. 64). 
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(a + bi) — (c + di) = (a — e) + (b — d)i, 
a+bi (a + bi) (e — di) (s) (E) [5] 


c2? + d2 c2? + d2 Es 


c+di (e+ di) (edi) 
(La segunda ecuación carece de significado cuando c + di = 0 + Oi, 
pues en este caso c? + d? = 0. Así que de nuevo debemos excluir la 
división por cero; es decir, por 0 + Oi.) P. ej.: 


Q+30)-(14+4)=1-i, 
243i 24+3í 1-4 2-8 +31+12 14 


El cuerpo de los números complejos incluye el cuerpo de los núme- 
ros reales como un subcuerpo de él, pues el número complejo a + Oi 
puede considerarse igual al número real a. Por otra parte, un número 
complejo de la forma 0 + bi se llama imaginario puro. 


Ejercicios: 
1+DQ04+0D6+)D 
ai 


1. Exprésese en la forma a + bi. 


o 1 v3y? 
2. Exprésese | — z +i EE en la forma a + bi. 
3. Exprésense en la forma a + bi: 


1+i 1+i 1 1 (4 — 5i)? 
1—i?2—i’ i’ (—2 + i) (1 — 3i)’ (2 — 3i)? 





4. Calcúlese y5 + 12i. (Indicación: Escríbase y5 + 12i = x + yi, elévese 
al cuadrado e iguálense partes reales e imaginarias.) 


Mediante la introducción del símbolo i hemos extendido el cuerpo 
de los números reales al cuerpo de los símbolos a + bi, en el cual la 
ecuación cuadrática especial 


xr? = —1 
tiene las dos soluciones x = i y x = —i. En efecto, por definición, 
i» i = (—i) (—i) = i? = —1. En realidad, hemos conseguido mucho 


más, pues es fácil comprobar que ahora toda ecuación cuadrática, que 
podemos escribir en la forma 


az? + bz + ¢ = 0, [6] 


tiene solución. En efecto, de [6] resulta 
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b c 
zr? + — r = ——, 
a a 
P b b? b2 c 
+ +? as 4a2 a? 


E 4a? 17] 


b + y b? 4ac 
2a 2a r 





—b + vy b? — 4ac 
2a 


Ahora bien: si b? — 4ac > 0, yb? — 4ac es un número real ordinario 
y las soluciones [7] son reales, mientras que si b? — 4ac < 0, entonces 
4ac — b > 0 y yb3— 4ac = y— ac —b3) = i y 4ac — br, de for- 
ma que las soluciones [7] son números complejos; p. ej., las solucio- 
nes de la ecuación 


x2? — 5r 4+ 6 = 0, 


son x = (5 + v25 — 24)/2 = (5 + 1)/2 = 2 y 3; en tanto que las 
soluciones de la ecuación 


x2? — 2r +2 =, 
son x = (2 + y4 — 8)/2 = (2 + 2/2 =1 +iyl—i. 


2. Interpretación geométrica de los números complejos.--Ya en el 
siglo xv1 los matemáticos se vieron obligados a introducir simbolos 
para representar las raíces cuadradas de los números negativos y poder 
resolver todas las ecuaciones cuadráticas y cúbicas. Sin embargo, no 
fueron capaces de explicar el significado exacto de estos símbolos, que 
eran considerados con cierto temor supersticioso. El nombre de «ima- 
ginarios» es todavía un vestigio del hecho de que estas expresiones fue- 
ran consideradas como algo ficticio e irreal. Por fin, a principios del 
siglo xix, al ponerse de manifiesto la importancia de estos números 
en muchas ramas de las matemáticas, una sencilla interpretación geo- 
métrica de las operaciones con los números complejos fué suficiente 
para hacer desaparecer las dudas acerca de su validez. Por supuesto 
que tal interpretación es innecesaria desde el punto de vista moderno, 
de acuerdo con el cual la justificación del cálculo formal con los núme- 
` ros complejos está basada directamente sobre las definiciones forma- 
les de adición y multiplicación. Pero la interpretación geométrica, que 
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fué dada casi al mismo tiempo por Wessel (1745-1818), Argand (1768- 
1822) y Gauss, hizo que estas operaciones resultaran más naturales 
desde un punto de vista intuitivo, habiendo resultado, por otra parte, 
de la mayor importancia en las aplicaciones de los números complejos 
a la matemática y a las ciencias físicas. 

Esta interpretación geométrica consiste simplemente en represen- 
tar el número complejo z = x + yi por el punto del plano de coorde- 
nadas rectangulares x, y. Así, la parte real de z es su coordenada zx, 
y la parte imaginaria su coordenada y. Con ello queda establecida una 
correspondencia entre los números complejos y los puntos del «plano 
numérico», en forma análoga a la correspondencia establecida en II 
entre los números reales y los puntos de una recta, la recta numérica. 
Los puntos del eje x del plano numérico corresponden a los números 
reales:z = x + 0i, mientras los puntos del eje y corresponden a los 
números imaginarios puros z = 0 + yi. 

Si 

z=2Xx+yi 


es un número complejo cualquiera, al número complejo 
z=x-—yi 


lo llamaremos conjugado de z. El punto z se representa en el plano 
numérico por el simétrico del punto z respecto al eje x. Si designa- 
mos la distancia desde el origen al 
punto z por p, entonces, por el teo- 
rema de Pitágoras 


p? = x? + y? = (x + yla — y) = z > 2. 


El número real p = yz? + y? se lla- 
ma módulo de z, y se escribe 


p=|z1. 


Si z está sobre el eje real, su módulo 
; es su valor absoluto ordinario. Los nú- 
Fic. 22.—Representación geométrica E ' 5 
de los números complejos. El punto meros complejos de módulo 1 están 
z tiene como e sobre la «circunferencia unidad», con 
centro en el origen y radio 1. 
Si |z| = 0 entonces z = 0. Esto resulta de la definición de |z | 


como distancia de z al origen. Además, el módulo del producto de dos 
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números complejos es igual al producto de sus módulos: 
[2-23 = |z |> [za]. 


Esta propiedad resulta de un teorema más general que será demos- 
trado en la página 105. 


Ejercicios: 

1. Demuéstrese este teorema basándose directamente en la definición de pro- 
ducto de dos números complejos zı = xı + Yil y Za = £a + Yoi. 

2. Basándose en el hecho de que el producto de dos números reales únicamente 
es 0 si uno de los factores es 0, demuéstrese el teorema correspondiente para los 
números complejos. (Hágase uso de los dos teoremas que se acaban de enunciar.) 


De la definición de suma de dos números complejos, 2¿=%1+Yi y 
Z2=%2 + yoi, se tiene 


21 + 22 = (01 + 28) + (Yı + ya)i. 


Por tanto, el punto 2, + za está representado en el plano numérico por 
el cuarto vértice de un paralelogramo cuyos otros tres vértices son 
los puntos 0, 21, z2. Esta sencilla construcción geométrica de la suma 
de dos números complejos es de gran 
importancia en muchas aplicaciones; 
de ella puede deducirse la consecuen- 
cia importante de que el módulo de la 
suma de dos números complejos no ex- 
cede nunca a la suma de los módulos 
(véase la pág. 66): 





la +z3[<|21+!|2a)1. Fic. 23.—Construcción geométrica de 
la suma de dos números complejos. 


Esta propiedad resulta del hecho de 
ser la longitud de un lado cualquiera de un triángulo menor que la 
suma de las longitudes de los otros dos. 


Ejérciclo: ¿En qué caso tiene lugar la igualdad |z1 + 23| =|21| +|z2!? 


El ángulo formado por la dirección positiva del eje x y la recta Oz 
se llama argumento de z, y se representa por ọ (Fig. 22). El módulo 
de z es el mismo que el de z 


(2|=/2], 
pero el argumento de z es opuesto al de z; esto es, 


p= ~e 
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Naturalmente, el argumento de z no está determinado únivocamente, 
ya que puede sumarse o restarse a un ángulo cualquier múltiplo 
entero de 3600, sin que esto afecte a la posición gráfica de sus lados. 
Así, p. ej., 


P» p + 360°, p + 7209, œ + 10800,-- ++, 
p — 360°, y — 720°, q — 10800, +» * 


representan todos gráficamente el mismo ángulo. Utilizando el módulo 
p y el argumento q, el número complejo z puede escribirse en la forma 


z = x + yi = p(cos p + iseng); [8] 
en efecto, por definición de seno y coseno (véase Cap. VI, 1, 2), 
z£ = Ẹ COs Q, y = psen ọ. 


Por ejemplo, para z = i, p = 1, q = 909, de manera que i = 
= 1 (cos 90° + i sen 900); 


para z=1+ e = V2, q = 459, de modo que 
1 + i = y2 (cos 459 + i sen 459); 
para z=1-—i, p = V2, q = —450, de modo que 
; 1 — i = y2 [cos (—45°) + i sen (—45°)]; 
para 2=-—1+ y31, p = 2, q = 120°, de forma que 


—1 + 43 i = 2 (cos 120° + ¿sen 1209), 


El lector puede comprobar estas igualdades por sustitución de los 
valores de las funciones trigonométricas. 

La representación trigonométrica [8] es de gran interés en el caso 
de la multiplicación de números complejos. Pues si 


z = p(cos y + isen q), 
y z = p(cos q” + ¿sen q”), 
se tiene zz’ = pp” { (cos p cos p” — sen ọ sen q”) + 
+ í(cos p sen q” + sen q cos q”) } 


Ahora bien: por los teoremas de adición del seno y del coseno, 


cos p cos g’ — sen p sen p” = cos (p + q”), 
cos y sen q” + sen q eos y” = sen (p + 9%). 


Por consiguiente, 


zz’ = pp” [ cos (p +-p")-+ isen (p +9) ). [9] 
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Esta es la forma trigonométrica del número complejo de módulo pp’ 
y argumento ọ + q”. En otras palabras, para multiplicar dos números 
complejos se multiplican sus módulos y se suman sus argumentos (figu- 
ra 24), Vemos así que la multi- 
plicación de números complejos 
está relacionada con la opera- 
ción geométrica de rotación. Con 
más precisión, denominemos al 
segmento dirigido que une el 
origen con el punto z vector z; 
la longitud de éste será ọ=| z |. 
Sea z' un número sobre la cir- 
cunferencia unidad, es decir, 
p' = 1; entonces, al multiplicar 
z por z’ el vector z gira un 
ángulo igual a q”. Si p" 4 1, la 
longitud del vector ha de ser 
multiplicada por p’ una vez 


¡ FiG, 24,—Multiplicación de dos números 
efectuada la rotación. El lector comicos Los arguietos se S vii 





puede comprobar gráficamente módulos se multiplican. 
estos hechos, haciendo el pro- 
ducto de varios números por zı = i (giro de 900); z2 = —i (giro de 900 


en sentido opuesto); 3 = 1 + i, y z4 = 1—i. 
La fórmula [9] tiene una consecuencia particularmente importante 
cuando z = 7z’, pues en este caso resulta 


z2 = p?(cos 2p + isen 2). 
Al multiplicar de nuevo por z obtenemos 
z3 = pł(cos 3p + i sen 3¢ọ), 
y si se continúa indefinidamente en esta forma, 
za = pr(cos nọ + isen np) para cualquier entero n. [10] 


En particular, si z es un punto de la circunferencia unidad, p = 1, 
obtenemos la fórmula dada a conocer por el matemático inglés A. De 
Moivre (1667-1754): 


(cos p + isen p)? = cos nọ + isen ną. [11] 


Esta fórmula es una de las más notables y útiles de las matemáti- 
cas elementales, según vamos-a poner de manifiesto con un ejemplo. 
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Si aplicamos la fórmula para n = 3 y desarrollamos el primer miem- 
bro por la fórmula del binomio 


(u + v)? = u3 + 3u?o + 3uv? + y3, 
se obtiene la relación 
cos 3p + i sen 3p = cos? p — 3 cos y sen? ọ + (3 cos? y sen y — sen? q). 


Una sola ecuación, tal como ésta, entre dos números complejos equi- 
vale a un par de ecuaciones entre números reales, pues la igualdad de 
dos números complejos exige la igualdad de sus partes reales e ima- 
ginarias, respectivamente. En consecuencia podemos escribir 


cos 3p = Cos3p — 3cosp sento, sen 3p = 3 cos? ọ sen y — sen? p. 
Si utilizamos la igualdad 
cos3p + sen? ọ = 1, 
se obtiene finalmente 


cos 3p = cos? p — 3 cos p(1 — cos? p) = 4 cos? ọ — 3 cos q, 
sen 3p = —4sen3 y + 3 sen ọ. 


Fácilmente pueden obtenerse fórmulas análogas para cualquier valor 
entero n que expresen sen nọ y cos nọ en función de las potencias de 
sen ọ y cos q, respectivamente. 


Ejercicios: 

1. Hállense las fórmulas correspondientes para sen 4p y cos 4p. 

2. Demuéstrese que para un punto, z = cos ọ + isen ọ, de la circunferencia 
unidad, 1/z = cos p — i sen q. 

3. Pruébese, sin efectuar cálculos, que (a + bi)/(a — bi) tiene siempre mó- 
dulo 1. 

4. Si zı y Za son dos números complejos, demuéstrese que el argumento de 
zı — Za €s igual al ángulo formado por el eje real y el vector dirigido de zz a zı. 

5. Interprétese. el argumento del número complejo (zı — 22)/(z1 — z3) en el 
triángulo formado por los puntos 21, za y Z3. 

6. Demuéstrese que el cociente de dos números complejos del mismo argu- 
mento es real. 

7. Demuéstrese que si dados cuatro números complejos 21, 23, 23, 74, los ar- 
gumentos de (za — 21)/(23 — 22) y (24 — 21)/(24 — zs) son iguales, los cuatro pun- 
tos están sobre una circunferencia o una recta, y recíprocamente. 

8. Demuéstrese que la condición necesaria y suficiente para que los cuatro 
puntos Z1, 23, 23» za estén sobre una circunferencia o una recta es que sea real el 


cociente 
Za — 21 Z4 — 21 
Z3 — Zg Za — Z3 
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3. Fórmula de De Moivre y raíces de la unidad.—Entendemos por 
raíz n-ésima de un número a aquel número b tal que bn = a. En par- 
ticular, el número 1 tiene dos 
raíces cuadradas, 1 y —1, pues 
12 = (-1)? = 1. El número 1 tie- 
ne una sola raíz cúbica real mien- 
tras que tiene cuatro raíces cuar- 
tas: los números reales 1 y —1 y 
los imaginarios i y —i. Estos he- 
chos sugieren que debe haber otras 
dos raíces cúbicas de 1 en el cam- 
po complejo, haciendo un total 
de tres. Que efectivamente es así 
puede verse sin dificultad me- 
diante la fórmula de De Moivre. 

Vamos a demostrar que en el 
cuerpo de los números complejos 
hay exactamente n raices n-ésimas "A dad de las 
diferentes de 1, las cuales están re- 
presentadas por los vértices de un n-ágono regular inscrito en la circun- 
ferencia unidad, siendo uno de sus vértices el punto z = 1. Esto resulta 
casi evidente de la figura 25 (dibujada para el caso n = 12). El pri- 
mer vértice del polígono es 1, y el siguiente es 





600 3600 
+ isen E [12] 








& = Cos 


ya que swargumento debe ser la n-ésima parte del-4ngulo total de 3600; 
El vértice inmediato es a - a = a?, pues se obtiene girando el vector a 





po 
un ángulo de . El vértice siguiente será «3, etc., y, finalmente, 


después de reiterar n vecés, volvemos nuevamente al vértice 1; esto 
es, se tiene 


qn = 1, 


lo que también resulta evidente de la fórmula [11], ya que 








3600 3600 
cos + isen 


n 
| = Cos 360° + j sen 3600 = 1 + Oi. 


Resulta que «l = « es una raíz de la ecuación xn = 1, y lo mismo 
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add , o ES 720° 
ocurre con el vértice inmediato «2 = cos A + i sen a 
Esto se obtiene sin más que escribir 
(a2)2 = 42 = (qn)? = (1)2 = 1, 


o, por la fórmula de De Moivre: 








7290 , ' 720° 
(a2)n = cos |n ñ + isen (r A = Cos 720% + isen 720% = 1 + 0i = 1. 


De la misma manera veríamos que todos los n números 
1, a, a, &3, ++», ani 


son raíces n-ésimas de 1. Si seguimos adelante en la sucesión de expo- 
nentes o utilizamos exponentes negativos, no se obtienen nuevas raí- 
ces; en efecto, al = 1/a = a4%/a = a-l, y an = 1, g+ = (a) a = 
.=1+ æ = 0, etc., de forma que se repiten los valores anteriores. Se 
deja como ejercicio al lector el demostrar que no hay 'otras raíces 
n-ésimas. 

Si n es par, uno de los vértices del n-ágono coincide con el punto 
—1, de acuerdo con el hecho algebraico de que en este caso —1 es 
una raíz n-ésima de 1. 

La ecuación a la que satisfacen las raíces n-ésimas de la unidad 


a1=0 [13] 


es de grado n, pero puede reducirse fácilmente a una ecuación de grado 
n — 1, para lo cual basta hacer uso de la identidad algebraica 


am — 1 = (x — 1) (22-14 22-24 qn-3 4 »-- +41), [14] 


Dado que el producto de dos números es 0 si, y sólo si, uno al menos de 
los factores es 0, el primer miembro de [14] se anula sólo si uno de los 
dos factores del segundo miembro es cero, esto es, sólo si r=1, o bien 


gn-1 4 20-24 qm34 -eHe HIO. [15] 


Por tanto, ésta es la ecuación a la que deben satisfacer las raíces «, 
a2, ... , ani, y recibe el nombre de ecuación ciclotómica (divisora de la 
circunferencia); p. ej., las raíces cúbicas imaginarias de 1, 


a = cos 120° + i sen 120° = 1/({—1 + iv 3), 
æ? = cos 2400 + isen 240° = 1/a(—1 — iy 3), 
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son las raices de la ecuación 
a2tr+1=0, 


como puede comprobar el lector por sustitución directa. Análogamente, 
las raíces quintas de 1, aparte la unidad, satisfacen a la ecuación 


2142034242410. [16] 


Para construir un pentágono regular debemos resolver esta ecua- 
ción de cuarto grado, la cual, por un simple artificio algebraico, se 


. 1 Ea 
reduce a una ecuación cuadrática en w = x + e Si dividimos [16] 


por a? y reagrupamos los términos: 
a? l t E 1 0 
+++ +1=0 


2 1 
o bien, ya que (z + =) =g? + z + 2, obtenemos la ecuación 
w2+w-—i1=0,. 
Mediante la fórmula [7] anterior, esta ecuación tiene las raíces 


=1+v5 -1- v5 


tw = 2 > w= 3 


Por consiguiente, las raíces quintas de 1 son las correspondientes a 
dos ecuaciones cuadráticas 


=w, o 24+Y4y/5-—ie+1 


l 
S 


1 
z+ — 
Xx 


2 0 12-Yay541r4+1=0, 


+ 


ll 
& 


1 


|= 


que el lector puede resolver por medio de la fórmula ya utilizada. 


Ejercicios: 

1. Hállense las raices sextas de 1. 
Calcúlese (1 + i)! A 
Hállense los diferentes valores de y1 + i, v 


5 


A a 
7—4ivi, y — Í. 


SAN 


1 
Calcúlese — (? — i77). 
2i 
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*4, El teorema fundamental del álgebra.—No sólo toda ecuación 
de la forma ax? + bx + c =0 6 de la forma x2 — 1 = 0 es resoluble en 
el cuerpo de los números complejos, sino que se verifica en general que 
toda ecuación algebraica de grado n, de coeficientes reales o complejos, 


A(x) = 19 + Op-¡an=1 + ap-922=2 + +++ “ar + ao = 0, (17] 


tiene soluciones en el cuerpo de los números complejos. Este resultado 
fué establecido para las ecuaciones de tercero y cuarto grados en el 
siglo xvi por Tartaglia, Cardano y otros, que resolvieron dichas ecua- 
ciones mediante fórmulas esencialmente análogas a la de la ecuación 
de segundo grado, si bien mycho más complicadas. Durante casi dos- 
cientos años se estudiaron con gran insistencia las ecuaciones de 
quinto grado y grados superiores; pero todos los esfuerzos para resol- 
verlas por métodos similares fracasaron. Fué una gran hazaña del 
joven Gauss el dar la primera demostración completa en su tesis doc- 
toral (1799) de la existencia de soluciones, aunque la cuestión de gene- 
ralizar las fórmulas clásicas que expresan las soluciones de las ecuacio- 
nes de grado inferior al quinto mediante operaciones racionales y ex- 
tracción de raíces quedó sin respuesta en su tiempo (véase pág. 128). 

El teorema de Gauss dice que para toda ecuación algebraica de la 
forma [17], donde n es un entero positivo y los coeficientes números 
reales cualesquiera o incluso números complejos, existe al menos un 
número complejo a = c + di tal que 


f(a) = 0. 


El número «a se llama una raiz de la ecuación [17]. Daremos una de- 
mostración de este teorema en el Apéndice. del capítulo V. Si de 
momento lo consideramos demostrado, podemos probar el llamado 
teorema fundamental del álgebra (con mayor propiedad debería llamarse 
teorema fundamental del sistema de los números complejos); esto es, 
todo polinomio de grado n 


[(2) = 29 + an- y... + 413400, (18) 
puede descomponerse en el producto de exactamente n factores 
Hu) = (1 — a1) (1 — a2) ` ' (x— an), 119] 


siendo «1, «2, 43, ... , an números complejos, raices de la ecuación f(x) =0. 
Como ejemplo para aclarar este teorema, el polinomio 


f(x) = x$ — 1 
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puede escribirse en la forma 
Ha) = (2 — 1) (2 — i) (2 + i) (2 + 1). 


De la descomposición [19] resulta evidente que las œ son raíces de 
la ecuación f(x) = 0, ya que para x = q, un factor de f(x), y en con- 
secuencia f(x) mismo, es igual a cero. 

En algunos casos los factores (x — «1), (x — as), ... de un polino- 
mio f(x) de grado n no son todos distintos, como se ve en el ejemplo 


fa) = xz? — 2x + 1 = (£ — 1) (æ — 1), 


que tiene sólo la raíz x = 1, «contada dos veces» o «con multiplicidad 
2». En todo caso, un polinomio de grado n no puede tener más de n 
factores distintos (1 — a), y la correspondiente ecuación, n raíces: 

Para demostrar el teorema de la descomposición en factores, ha- 
remos uso de la identidad algebraica 


xk — ak = (x — am) (21 4 agk-2 + a2gko8 +: ++ 0k-2x + ak-1), [20] 


que para «æ = 1 se reduce a la fórmula de sumación de una progresión 
geométrica. Como hemos supuesto que se verifica el teorema de Gauss, 
podemos admitir que a =a; es una raíz de la ecuación [17], de modo que 


=l — 
[(a1) = % + an-1%1 + an-20) 24 +4 aa + ao = O. 


Restando ésta de f(x) y reagrupando los términos, obtenemos la 
identidad 
NE) = (2) — ia) = (22 — a) + Alan — a) + 121) 


-e + ada — es). 


Ahora bien: según [20], podemos sacar el factor (x—«ı) de cada térmi- 
no de [21], con lo cual el grado del otro factor de cada término se re- 
duce en una unidad. Si de nuevo reagrupamos los términos, se obtiene 


f(x) = (x — agla), 


donde g(x) es un polinomio de grado n — 1: 


g(x) = 201 4 bn- +++ + bix + bo. 


(Para nuestro objeto resulta innecesario calcular los coeficientes by.) 
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Ahora podemos aplicar el mismo procedimiento a g(x); por el teorema 
de Gauss, existe una raíz ag de la ecuación g(x) = 0, de modo que 


g(x) = (x — a3)h(x), 


siendo h(x) un polinomio de grado n — 2. Reiterando el mismo pro- 
ceso un total de (n — 1) veces (por supuesto que esta frase no es sino 
un equivalente del proceso de inducción matemática) obtenemos final- 
mente la descomposición completa en factores 


Hx) = (x — a) (x — 09) (x — as)... (z — Am). (22) 


De [22] resulta no sólo que los números complejos æi, %2, ... , %n 
son raíces de la ecuación [17], sino también que son sus únicas raíces; 
pues si fuera y una raíz de la ecuación [17], por [22] se tendría 


19) = (y — a) (y — as) * * (Y —: an) = 0. 


Hemos visto en la página 103 que un producto de números comple- 
jos se anula si, y sólo si, uno. de los factores es igual a 0; en conse- 
cuencia, una de las diferencias (y — ar) debe ser nula, e y igual a ar, 
como queríamos demostrar. 


*VI. NÚMEROS ALGEBRAICOS Y TRASCENDENTES 


1. Definición y existencia.—Un número algebraico es cualquier nú- 
mero zx, real o complejo, que satisface a una ecuación algebraica de 
la forma 


Ant? + Apr 1 ¿4 a+ ao =O (n.>1, an 40)  [1) 


donde los coeficientes ax son enteros; p. ej., y/2 es un número alge- 
braico, pues satisface a la ecuación 


x2-2=0. 


En forma análoga, toda raíz de una ecuación de coeficientes enteros 
de grados 3.0, 4.9, 5.9, o superior es un número algebraico, sean o no 
expresables dichas raíces mediante radicales. El concepto de número 
algebraico es una generalización natural del de número racional, que 
constituye el caso especial para n = 1. 

Que no todo número real es algebraico puede probarse por un 
procedimiento debido a Cantor, consistente en demostrar que el con- 
junto de los números algebraicos es numerable. Como el conjunto de 
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todos los números reales no es numerable, de ello resulta la existencia 
de números reales no algebraicos. 

Un método para enumerar el conjunto de los números algebraicos 
es el siguiente: a cada ecuación de la forma [1] se le adjunta el en- 
tero positivo 


h=[a + fanal ++ [a + [o +n 


que llamaremos su altura. Para un valor fijo de h existe sólo un número 
finito de ecuaciones [1] de altura h, y cada una de éstas tiene a lo 
sumo n raíces diferentes; por tanto, existe sólo un número finito de 
números algebraicos cuyas ecuaciones son de altura h, y podemos 
ordenar todos los números algebraicos en una sucesión, partiendo de 
los de altura 1, a continuación los de altura 2, y así sucesivamente. 

Esta demostración de que el conjunto de los números algebraicos 
es numerable asegura la existencia de números no algebraicos; tales 
números se llaman trascendentes, pues, como dijo Euler, «trascienden 
al poder de los métodos algebraicos». 

La demostración de Cantor de la existencia de números trascen- 
dentes a duras penas puede llamarse constructiva. Teóricamente, se 
puede construir un número trascendente aplicando el proceso diagonal 
de Cantor a un cuadro numerable de las expresiones decimales de las 
raíces de las ecuaciones algebraicas; pero este procedimiento es por 
completo impracticable y no conduciría a ningún número del que se 
pudiera escribir realmente su expresión en el sistema decimal o en 
otro cualquiera. Por otra parte, los problemas más interesantes rela- 
tivos a los números trascendentes se reducen a demostrar que ciertos 
y determinados números, tales como v y e (estos números serán defi- 
nidos en el capítulo IV) son, en efecto, trascendentes. 

**2, El teorema de Liouville y la construcción de números tras- 
cendentes.—Una demostración de la existencia de números trascen- 
dentes anterior a la de Cantor fué dada por J. Liouville (1809-1882), 
y permite efectivamente construir ejemplos de tales números. Es algo 
más difícil que la demostración de Cantor, como ocurre casi siempre 
con las demostraciones constructivas comparadas con las que se li- 
mitan a probar la existencia. Incluímos la demostración para conoci- 
miento del lector más preparado, aunque tampoco requiere gran ba- 
gaje matemático. 

Liouville demostró que los números algebraicos irracionales son 
aquellos que no pueden ser aproximados mediante números racionales 
con un alto grado de exactitud, salvo que los denominadores de las 
fracciones que constituyen dichas aproximaciones sean muy grandes. 


114 SISTEMAS DE NÚMEROS [caP. 2 


Supongamos que el número z satisface a la ecuación algebraica de 
coeficientes enteros 


[(2) = ao + aix + aax? +... +anin=0 (An Æ 0), 12] 


pero no a una ecuación de grado inferior. Se dice entonces que z es un 
número algebraico de grado n; p. ej., z = y2 es un número algebraico 
de grado 2 por satisfacer a la ecuación x? — 2 = 0 y no ser raíz de 
ninguna ecuación de primer grado; z.= Y2 es de tercer grado, ya que 
satisface a la ecuación 18 — 2 = 0 y, según hemos visto en el capítu- 
lo ITI, a ninguna ecuación de grado inferior. Un número algebraico de 
grado n > 1 no puede ser racional, pues un número racional z=p/q 
satisface a la ecuación de grado 1, qx — p = 0. Ahora bien: todo 
número irracional z puede aproximarse hasta el grado de exactitud 
deseado por un número racional, lo que significa que podemos deter- 
minar una sucesión 


Pı P3 
q’ q’ 


de números racionales con denominadores crecientes tales que 


Pr 


— > 7. 


qr 


El teorema de Liouville afirma que para todo número algebraico z de 
grado n > 1 tal aproximación debe adolecer de un error mayor que 
1/gn+1; esto es, que la desigualdad 


13] 


1 

i z— Fa > qua 

t E 

subsiste para denominadores q suficientemente grandes. 
Nos proponemos demostrar el teorema; pero en primer lugar vamos 

a ver cómo permite la construcción efectiva de números trascendentes. 

Sea el número (véase pág. 25 para la definición del símbolo n!) 


z= a + 10-1! + aa 10-21 + ag + 10-73! >> + am: 10m! + 
+ Am+1 > 10-(m+! + -+ + = 0,a1a2000a300000000000000000a 40000000... 


donde los a; son números dígitos arbitrarios de 1 a 9 (podemos, p. ej., 
elegir todos los a; iguales a 1). Tal número se caracteriza por el rápido 
crecimiento de las series de ceros, interrumpidas por dígitos aislados 
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no ceros. Designemos por Zm la fracción decimal finita obtenida to- 
mando sólo los términos de z hasta incluir el am + 10-=!, Entonces 


|Z — Zm | < 10: 10-m+D1, 4] > 


Supongamos que z fuera algebraico de grado n, y pongamos en [3] 
piq = Zm = p/10M!, con lo que obtenemos 


1 


[22m] > 10(2+1)m1 


para m suficientemente grande. Combinando esta desigualdad con 
la [4] tendríamos 


1 10 1 
lomim < 1OGMEDI ~ 1O(m+11-1 > 


de modo que (n + 1)m! > (m + 1)! — 1 para todo m suficientemente 
grande, y esto es evidentemente falso para todo valor de m mayor que 
n (el lector puede hacer una demostración detallada de esta afirmación), 
lo que conduce a una contradicción; en consecuencia, z es trascendente. 

Queda ahora por demostrar el teorema de Liouville. Supongamos 
que z es un número algebraico de grado n > 1 que satisface a [1], 
de forma que 

Ke) = 0. [5] 


Sea Zm = Pm/9m una sucesión de números racionales tales que 2m>z. 
Entonces 


Em) = [(m) — f2) = am — 2) + aala — 22) + *** + 02 > 20), 


Dividiendo ambos miembros de la ecuación por Zm — z, y utilizamdo 
la identidad algebraica 





ur — ya 
= u®-l + un-—2y + un-3y2 tee uvn-2 + pat 
u— v 
obtenemos 
b 
£ 2 = M1 + a2(žm + 2) + az + Zmz +223) c+ [6] 
2 % 


+ e at, 


Como Zm tiene por límite z, para valores grandes de m diferirá de z en 
menos de 1, por lo que podemos escribir, para valores suficientemente 
grandes de m, 
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Im) 


Im — zZ 


<la|+2la21(121+D0+3]a8/(121 + D2+:::+ [7 
+n]jan|(|2|+ 1)1=M, 








que es un número fijo, ya que suponemos fijo z en nuestro razona- 
miento. Si ahora elegimos m suficientemente grande para que el de- 
nominador qm de zm = Pm/qm sea mayor que M, se tendrá 


Kem) | lEn) | 
— za | > AE E 8 
|Z — Z7m| > M > de [8] 
Por brevedad escribamos p y q en lugar de Pm y qm: Entonces 
a + n-1 ... 'n, n 
jeje ENP AE p 19] 


q2 


Ahora bien: el número racional zm = p/q no puede ser raíz de f(x)=0, 
pues si así fuese se podría suprimir el factor (1 — Zm) de f(x), y z 
satisfaría a una ecuación de grado inferior a n; por consiguiente, 
H(2m) + 0. Pero el numerador del segundo miembro de [9] es entero; 
por lo menos, pues, igual a 1. Finalmente, de [8] y [9] tenemos 


[10] 


lo que demuestra el teorema 

Durante las últimas décadas ha avanzado mucho la investigación 
acerca de la posibilidad de aproximar los números algebraicos me- 
diante los racionales; p. ej., el matemático noruego A. Thue (1863- 
1922) demostró que en la desigualdad [3] de Liouville el exponente 
n + 1 puede ser sustituido por (n/2) + 1. C. L..Siegel probó poste- 
riormente el enunciado aún más preciso (más preciso para valores 
grandes de n) de que subsiste para el exponente 2y/n. 

El tema de los números trascendentes ha fascinado siempre a los 
matemáticos, pero hasta época muy reciente se conocían muy pocos 
ejemplos de números de interés intrínseco de los que se supiera eran 
trascendentes (en el capítulo III discutiremos el carácter trascendente . 
de x, del cual resulta la imposibilidad de efectuar la cuadratura del 
circulo con lá regla y el compás). En una famosa comunicación al 
Congreso internacional de matemáticas celebrado en Paris en 1900, 
David Hilbert propuso treinta problemas matemáticos fáciles de for- 
mular, algunos incluso en lenguaje elemental y hasta popular, pero 
ninguno de ellos resuelto y ni siquiera inmediatamente accesible a la 
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técnica matemática entonces existente. Estos «problemas de Hilbert» 
fueron un reto al subsiguiente período del desarrollo matemático, y 
casi todos han sido ya resueltos, constituyendo a menudo su solución 
un claro progreso de la potencia del instrumento matemático y de 
sus métodos generales. Uno de los problemas que parecían más inac- 
cesibles consistía en demostrar la trascendencia del número 


2v2 


o al menos probar que se trataba de un número irracional; durante 
más de treinta años no surgió ni la más remota esperanza de hallar 
un método prometedor de atacar el problema. Por fin Siegel e, inde- 
pendientemente, el joven matemático ruso A. Gelfond, descubrieron 
nuevos métodos para demostrar el carácter trascendente de muchos 
números importantes de la matemática, incluído el número de Hilbert 


2V3, y más en general, cualquier número de la forma ab siendo a un 
número algebraico 4 0 ó 1, y b un número algebraico irracional. 


SUPLEMENTO AL CAPÍTULO II 


EL ÁLGEBRA DE LOS CONJUNTOS 


1. Teoría general.—El concepto de clase o conjunto de objetos es 
uno de los más fundamentales de la matemática. Se define un conjunto 
mediante una propiedad o atributo A que cada objeto considerado 
debe poseer o no; aquellos objetos que poseen la propiedad forman un 
conjunto correspondiente A. Así, si consideramos los enteros, y la 
propiedad Y es la de ser primo, el conjunto correspondiente A es el 
constituído por todos los números primos 2, 3, 5, 7, ... 

El estudio matemático de los conjuntos se basa en el hecho de 
que éstos pueden ser combinados mediante ciertas operaciones para 
formar otros conjuntos, al igual que los números 3e combinan por 
adición y multiplicación para dar lugar a otros números. El estudio 
de las operaciones con los conjuntos constituye el «álgebra de conjun- 
tos», que tiene muchas semejanzas formales (aunque también presenta 
diferencias) con el álgebra de los números. El hecho de que los méto- 
dos algebraicos puedan aplicarse al estudio de objetos no numéricos, 
como los conjuntos, pone de manifiesto la gran generalidad de con- 
ceptos de la matemática moderna. En los últimos años se ha visto 
que el álgebra de los conjuntos ilumina muchas ramas de la matemá- 
tica, tales como la teoría de la medida y la teoría de las probabilida- 
des; resulta también valiosa en la reducción sistemática de los con- 
ceptos matemáticos a sus fundamentos lógicos. 

En lo que sigue I representará un conjunto fijo de objetos de natu- 
raleza cualquiera que llamaremos conjunto universal o universo, y 
A, B, C, ... representarán subconjuntos arbitrarios de I. Si I es el 
conjunto de todos los enteros, A puede representar el conjunto de los 
enteros pares, B el de los impares, C el de los números primos, etc. 
O bien I puede ser el conjunto de todos los puntos de un plano dado, 
A el de todos los puntos interiores a una circunferencia determinada, 
B el conjunto de todos los puntos de otro círculo del plano, etc. Por 
conveniencia incluímos como «subconjuntos» de I al propio conjunto I 
y al «conjunto vacío» O, que no contiene elementos. El propósito de 
esta generalización artificial es el de conservar la regla de que a toda 
propiedad Y corresponda el subconjunto A de todos los elementos 
de Z que poseen dicha propiedad. En el caso de que Al sea alguna pro- 
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piedad válida universalmente, tal como la expresada por la ecuación 
trivial x = x, el correspondiente subconjunto de Z será el mismo 7J, 
puesto que todo objeto satisface a esta ecuación, en tanto que si A 
es alguna propiedad contradictoria en sí misma, como x Æ x, el co- 
rrespondiente subconjunto no contendrá ningún objeto y lo represen- 
taremos por el símbolo O, 

El conjunto A se dice que es un subconjunto del B si no hay nin- 
gún objeto en A que no esté también en B. En este caso escribimos 


ACB o BDA. 


P. ej., el conjunto A de todos los enteros múltiplos de 10 es un sub- 
conjunto del conjunto B de los enteros múltiplos de 5, ya que todo 
múltiplo de 10 lo es también de 5. La afirmación de A C B no ex- 
cluye la posibilidad de que sea BC A. Si ambas relaciones tienen 
lugar, decimos que los conjuntos A y B son iguales y escribimos 


A=B. 


Para que esto se verifique, cada elemento de A debe pertenecer a B, 
y recíprocamente; de modo que los conjuntos A y B contienen exac- 
tamente los mismos elementos. 
La relación A C B tiene muchas analogías con la relación de Sides 
< b entre los números reales. En particular se verifica que 


1) ACA. 
2) S ACBy BCA, A=B. 
3) SSACByBCC, ACC. 


Por esta razón la relación A C B se denomina una «relación de orden». 
Su principal diferencia con la relación a < b para los números consiste 
en que, mientras para cada par de números a y b subsiste siempre 
una de las relaciones a < b ó b < a, esto no se verifica para los con- 
juntos; p. ej., si A designa el conjunto formado por los enteros 1, 2, 3, 


A=(1,2,3 h 
y B el formado por los números 2, 3, 4, 
B = {2,3,4}, 


entonces ni AC B ni BC A. Por esta razón, la relación A C B se 
dice que determina una ordenación parcial de los conjuntos, mientras 
la relación a <b determina una ordenación completa entre los números. 
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De pasada observemos que en virtud de la definición de la rela- 
ción Á C B resulta que 


4) OC A para cualquier conjunto A, y 
5) ACI, 


siendo A cualquier subconjunto del universo Z. La relación 4) puede 
resultar un tanto paradójica, pero se halla de acuerdo con la inter- 
pretación estricta del signo C . Pues la afirmación OC A sería falsa 
sólo si el conjunto vacío O contuviese un objeto no contenido en A, 
y como el conjunto vacío no contiene objeto alguno, resulta esto im- 
posible, cualquiera que sea el conjunto A. 

Vamos a definir ahora dos operaciones con conjuntos que tienen 
muchas de las propiedades algebraicas de la adición y multiplicación 
ordinarias de números, aunque conceptualmente son muy distintas. 
Sean A y B dos conjuntos cualesquiera; entenderemos por «unión» o 
«suma lógica» de A y B el conjunto formado por todos los objetos 
que pertenecen, bien a A o a B (incluídos los que puedan pertenecer 
a ambos), y este conjunto lo representaremos por el símbolo A + B. 
Definimos la «intersección» o «producto lógico» de A y B como el 
conjunto formado únicamente por aquellos elementos que  pertene- 
cen a ambos conjuntos A y B, y lo representaremos por el símbolo 
A * B, o simplemente AB. Para aclarar estas operaciones, sean de 
nuevo Á y B los conjuntos 


Á 
Entonces A+B 


{1,2,3}, B = {2,3,4}, 
{1,2,3,4} AB = {2,3}. 


, 


Entre las propiedades algebraicas importantes de las operaciones 
A + B y AB se encuentran las siguientes, que pueden ser compro- 
badas por el lector basándose en la definición de las mismas: 


6) A4B=BH+A 7) AB = BA 

8) A+(B+0)=(4A+B)4+C 9) A(BC) = (A B)C 

10) A4A=A 11) AA=A 

12) A(B + C) = (AB + AC) 13) A + (BC) = (A + B) (A + ©) 

14) A+0=A 15) AI= A 

16) A+I=I 17 A0=0 

18) la relación A C B es equivalente a una de las dos relaciones A + B = B, 
AB= A. 


La verificación de estas leyes es un problema de lógica elemental; 
p. ej., 10) dice que el conjunto formado por aquellos objetos que 
pertenecen, bien a A o a A es precisamente el conjunto A, mientras 
12) afirma que el conjunto formado por aquellos objetos que son de A 
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y también de B o de C es el mismo que el formado por aquellos obje- 
tos que pertenecen, hien a ambos A y B, o a ambos A y C. El razo- 
namiento lógico implicado en este y otros razonamientos puede acla- 
rarse mediante la representación de los conjuntos 4, B, C por recin- 
tos planos, teniendo cuidado de considerar todas las posibilidades en 
cuanto a que los conjuntos en cuestión tengan elementos distintos y 
comunes entre sí, 

Habrá observado el lector que las leyes 6), 7), 8), 9) y 12) coinci- 
den con las familiares leyes conmutativa, asociativa y distributiva del 
álgebra, de donde resulta que todas las reglas del álgebra ordinaria 
de números que sean consecuencia de dichas leyes son también váli- 





A+B AB 


Fic. 26.-——Adición e intersección de dos conjuntos. 


das en el álgebra de los conjuntos. Las leyes 10), 11) y 13), por otra 
parte, no tienen análogas en el caso de los números, lo que da al. 
álgebra de conjuntos una estructura más sencilla que la del álgebra 
de los números; p. ej., el teorema del binomio del álgebra ordinaria, 
en el álgebra de los conjuntos viene reemplazado por la igualdad 


(4 + B) =(A + B): (A+ B); -> (A+ B)=ARB, 


que es consecuencia de 11). Las leyes 14), 15) y 17) nos dicen que las 
propiedades de O e T respecto a la unión e intersección de conjuntos 
son muy similares a las propiedades de los números 0 y 1 respecto 
a la adición y multiplicación ordinarias. La ley 16) no tiene análoga 
en el álgebra de números. 

Queda por definir una ulterior operación del álgebra de los con- 
juntos: sea A un subconjunto cualquiera del conjunto universal Z. 
Por complemento de A en 7 entendemos el conjunto formado por todos 
los objetos de Z que no pertenecen a A, y representaremos este con- 
junto por el símbolo 4”. Así, si Z es el conjunto de todos los números 
naturales y A el de los números primos, A” estará formado por 1 y 
todos los números compuestos. La operación A”, que no tiene analogía 
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exacta en el álgebra de los números, goza de las siguientes propiedades: 


19 A+ A'=1 20) AA'=0 

21) 0'=I1 22) =0 

23) A” =A 

24) La relación A C B es equivalente a la relación B'C A’. 
25) (A + BY = A'B’ 26) (ABY = A' + P’. 


Dejamos de nuevo a cargo del lector la verificación de estas leyes. 
Las leyes 1) a 26) constituyen la base del álgebra de los conjuntos, 

y poseen la notable propiedad de «dualidad», entendida en el sentido 

siguiente: Si en una cualquiera de las leyes 1) a 26) los símbolos 


¡[al y =) 
(9) e J 
+ y y 


‘se intercambian (dondequiera que aparezcan), el resultado es de nuevo 
una de dichas leyes. 

P. ej., la ley 6) se transforma en la 7); la 12) en la 13); la 17) en 
la 16), etc. De ello resulta que a todo teorema que pueda demostrarse 
basándose en las leyes 1) a 26) corresponde otro teorema «dual», que se 
obtiene mediante los intercambios indicados, En efecto, como la demos- 
tración de todo teorema consiste en la aplicación sucesiva en cada 
etapa de alguna de las leyes 1) a 26), la aplicación a cada etapa de 
la ley dual nos dará la demostración del teorema dual (para una 
dualidad análoga en geometría, véase Cap. IV). 

2. Aplicación a la lógica matemática.—La verificación de las leyes 
del álgebra de conjuntos se apoya en el análisis del significado lógico 
de la relación A C B y de las operaciones A + B, AB y A'. Podemos 
ahora invertir este proceso y utilizar las leyes 1) a 26) como funda- 
mento de un «álgebra de la lógica». Con más precisión, aquella parte 
de la lógica concerniente a los conjuntos, o lo que es equivalente, las 
propiedades o atributos de los objetos, puede reducirse a un sistema 
algebraico formal basado en las leyes 1) a 26). El «universo lógico» 
define el conjunto J; cada propiedad o atributo U de los objetos define 
el conjunto A, constituido por todos los objetos de 1 que poseen este atri- 
buto. Las reglas para traducir la terminología lógica usual al lenguaje 
de los conjuntos quedan aclaradas con los siguientes ejemplos: 





«Bien A o B» A+B 
«Ambos A y B» AB 
«No A» A” 
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«Ni A ni Bo (A + BY, o de forma equivalente A'B’ 
«No ambos A y Bo (ABY, o de forma equivalente A’ + B’ 
«Todo A es B» o «Si A también 
B» o «A implica B» ACB 
«Algunos A son B» ABAO 
«Ningún A es Bo AB=0 
«Algunos A no son Bo AB' #0 
«No hay ningún A» A=0 


En términos del álgebra de conjuntos, el silogismo «Barbara», que 
dice: «Si todo A es B, y todo B es C, entonces todo A es C», se escribe 
sencillamente 


3) Si ACB y BCC, entonces ACC. 


Análogamente, la «ley de contradicción», que dice: «Un objeto no puede 
poseer simultáneamente un atributo y no poseerlo», se escribe 


20) AA’ = 0, 


mientras la «ley del tertio excluso» que dice: «un objeto debe poseer 
un atributo o no poseerlo» se transforma en 


1) A+A =1. 


Así, pues, la parte de la lógica que puede expresarse con los símbolos 
C, +,', y’ puede tratarse como un sistema algebraico formal sometido 
a las leyes 1) a 26). Esta fusión del análisis lógico de las matemáticas 
y del análisis matemático de la lógica ha dado lugar a una nueva 
disciplina, la lógica matemática, que se halla actualmente en vías de 
vigoroso desarrollo. 

Desde el punto de vista de la axiomática es notable el hecho de 
que las proposiciones 1) a 26), junto con todos los teoremas del álge- 
bra de conjuntos, puedan deducirse de las tres ecuaciones siguientes: 


A+ B=B+A 
27) (4+ B)+C=A+(B+0) 
(A+ BY+(4 + BY =A. 

Se deduce de ello que el álgebra de conjuntos puede construirse como 
una teoría puramente deductiva, al igual que la geometría euclidea, 
sobre la base de estas tres proposiciones aceptadas como axiomas. 
Cuando se ha hecho esto, la operación AB y la relación de orden 
AC B se definen a partir de A + B y A': 


AB representa el conjunto (4° + B'Y 
ACB significa que A + B = B. 
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Un ejemplo completamente distinto de un sistema matemático que 
satisface a todas las leyes formales del álgebra de conjuntos nos lo 
procuran los ocho números 1, 2, 3, 5, 6, 10, 15, 30, donde a + b se 
define como el mínimo común múltiplo de a y b; ab, como el máximo 
común divisor de a y b; aC b, como la afirmación «a es un factor de 
b», y a”, como el número 30/a. La existencia de ejemplos tales ha lle- 
vado al estudio de los sistemas algebraicos generales que satisfacen a 
las leyes 27). Dichos sistemas se llaman «álgebras de Boole» en honor 
de George Boole (1815-1864), matemático y lógico inglés, autor del 
libro An Investigation of the Laws of Thought, publicado en 1854. 


3. Una aplicación a la teoría de las probabilidades.—El álgebra de conjuntos 
aclara notablemente la teoría de las probabilidades. Para considerar sólo el caso 
más sencillo, imaginemos un experimento con un número finito de resultados 
posibles, todos los cuales se supondrán «igualmente probables». El experimento 
puede consistir, p. ej., en sacar una carta al azar de una baraja de 52 cartas per- 
fectamente barajadas. Si el conjunto de los resultados posibles del experimento 
se representa por I, y si A designa cualquier subconjunto de 7, entonces la proba- 
bilidad de que el resultado del experimento pertenezca al subconjunto A se define 
por el cociente 

número de elementos de A 


pla) = número de elementos de / 


Si designamos el número de elementos de un conjunto A por el símbolo n(A), 
esta definición puede escribirse en la forma 


ay. 2 1] 

PUO = aD 

En nuestro ejemplo, si A representa el subconjunto de «corazones», entonces 
n(A) = 13, n(1) = 52 y p(4) = 13/52 = 1/4. 

Los conceptos del álgebra de conjuntos intervienen en el cálculo de probabili- 
dades cuando se conocen las probabilidades de ciertos conjuntos y se desean calcu- 
lar las correspondientes a otros; p. ej., si conocemos p(A), p(B) y p(A B), podemos 
calcular la probabilidad p(A + B): 


p(A + B) = p(4) + p(B) — p(AB). [2) 
La demostración es inmediata; en efecto, 
n(A + B)= n(A) + NB) — n(A B), 


ya que los elementos comunes a A y a B, esto es, los elementos de AB, están 
contados dos veces en la suma n(A) + n(B), y, en consecuencia, debemos restar 
de esta suma n(A B) para obtener el resultado correcto que corresponde a n(A + B). 
Dividiendo cada término de esta igualdad por n(1) obtenemos la ecuación [2]. 

Se obtiene una fórmula más interesante al considerar tres subconjuntos, A, 
B, C, de I. De [2] resulta 


p(A + B + C) = p[(A + B) + C] = p(A4 + B) + p(C) — p[(A + B)Cl. 
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Por la ley 12) de la página 120 sabemos que (A + B)C = AC + BC. En conse- 
cuencia, 
PI(A + B)C] = p(AC + BC) = p(AC) + p(BC) — p(A BC). 


Sustituyendo en la ecuación previa este valor de p[((A + B)C] y el valor de 
- p(A + B) dado por [2], obtenemos el resultado deseado: 


p(A + B + ©) = p(A) + p(B) + 
+ p(C) — p(AB) — p(AC) — p(BC) + p(A BO). [3] 


Como ejemplo, consideremos el siguiente experimento: se escriben al azar los tres 

digitos 1, 2, 3 y se pide la probabilidad de que uno al menos ocupe su correspon- 

diente lugar. Sea A el conjunto de todas las permutaciones en las que el 1 está 

en primer lugar; B el de aquellas donde el 2 está en segundo lugar, y C el conjunto 

de todas las permutaciones en las que el 3 está en tercer lugar. Deseamos, por 
` tanto, calcular p(A + B + C). Es obvio que 


2 1 
p(A) = p(B) = p(C) =-7 = F> 


pues cuando un dígito ocupa su propio lugar hay dos ordenaciones posibles para 
los restantes dentro del total de 3-2-1 = 6 permutaciones posibles de los tres 
dígitos. Además, 

1 


P(AB) = p(AC) = p(BC) = ~ 


1 
p(ABC) = 5, 


ya que hay sólo una forma de presentarse para cada uno de estos.casos. De [3] 
resulta que 
Al 1 1 
pA +B+0=3: 33 — te” 


1 
2 


2 
3 


ll 
e 
[>] 
> 
> 
ES 


1 
+ 67 
Ejercicio: Hállese la fórmula correspondiente a p(A + B + C + D) y aplíquese 
al caso de cuatro dígitos. La probabilidad correspondiente es 5/8 = 0,6250. 


La fórmula general para la suma de n subconjuntos es 


PAL + Ar + o c+ An) = E p(As) =- E p(AJAy) + E p(A1AjAx) = 


— “+ p(A142---An), 14] 
donde los símbolos £, £, E. ++, X representan las sumas de todas las combina- 
1 2 3 n-1 
ciones posibles de los conjuntos A, A2,’ * *, An tomados uno a uno, dos a dos,: :*, 


(n — 1) a (n — 1). Esta fórmula puede establecerse por inducción matemática de 
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igual modo que dedujimos [3] a partir de [2]. De [4] es fácil probar que si los n 
` dígitos 1, 2, 3,: *-, n se escriben al azar, la probabilidad de que al menos un dí- 
gito dcupe su propio lugar es 


1 1 1 


1 
ca + [5] 


tort nt! 


Pa=1— 
en la cual el último término se toma con signo más o menos, según sea n par o 
impar. En particular, para n = 5, la probabilidad es 


EN EE EE N E 
=i- ta a FAT? i 


Veremos en el capítulo VIII que al tender n a infinito, la expresión 


2 1 1 1 1 
aaa 


tiende al límite 1/e, cuyo valor con cinco decimales es 0,36788. Dado que, por [5], 
Pn = 1 — Sn, queda demostrado que al tender n a infinito, 


Pn=> 1 — 1/e = 0,63212. 


CAPÍTULO III 


CONSTRUCCIONES GEOMÉTRICAS 
ÁLGEBRA DE LOS CUERPOS NUMÉRICOS 


Introducción.—Los problemas de construcción han sido siempre un 
tema favorito en geometría, Sólo con el auxilio de la regla y el compás 
puede realizarse una gran variedad de construcciones, como el lector 
debe recordar; puede construirse el punto medio de un segmento o la 
bisectriz de un ángulo; puede trazarse una recta perpendicular a otra 
desde un punto dado; puede ser inscrito un hexágono regular en una 
circunferencia, etc. En todos estos problemas, la regla se usa mera- 
mente como borde rectilíneo para dibujar rectas, pero no para medir 
o transportar distancias. La restricción tradicional de utilizar como 
únicos instrumentos la regla y el compás se remonta a la antigüedad, 
aunque los griegos no vacilaban en usar otros instrumentos. 

Uno de los más famosos entre los problemas clásicos de construc- 
ción es el llamado problema de Apolonio (hacia el año 200 a. de J.C.), 
en el cual se dan tres circunferencias arbitrarias del plano y se pide 
trazar una cuarta, tangente a las tres. En particular, una o más de 
las circunferencias dadas puede degenerar en un punto o en una recta 
(«circunferencia» de radio «cero» o «infinito», respectivamente); p. ej., 
se puede construir una circunferencia tangente a dos rectas dadas y 
que pase por un punto dado. Mientras resulta fácil resolver dichos 
casos especiales, el problema general es considerablemente más difícil. 

Entre todos los problemas de construcción, el de trazar con regla 
y compás el polígono regular de n lados tiene quizá el máximo inte- 
rés. Para ciertos valores de n, p. ej., n = 3, 4, 5, 6, la solución se 
conoce desde la antigüedad, y forma parte importante de la geome- 
tría elemental. Pero para el heptágono regular (n = 7) se ha demos- 
trado que la construcción es imposible. Hay otros tres problemas 
griegos clásicos para los cuales se ha buscado en vano una solución: 
la trisección de un ángulo arbitrario, la duplicación del cubo (es decir, 
la construcción de la arista de un cubo cuyo volumen sea doble del 
de un cubo de arista dada) y la cuadratura del círculo (esto es, la 
construcción de un cuadrado que tenga igual área que un círculo 
dado). En todos estos problemas los únicos instrumentos permitidos 
son la regla y el compás. Problemas de este tipo, que seguían sin re- 
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solverse, dieron nacimiento a uno de los más notables desarrollos de 
la matemática, cuando, después de siglos de investigación inútil, sur- 
gió la sospecha de que dichos problemas debian de ser definitivamente 
irresolubles. Los matemáticos se propusieron investigar la cuestión de: 
¿Cómo es posible probar que ciertos problemas: no pueden resolverse? 

En álgebra, fué el problema de resolver ecuaciones de quinto a 
superior grado el que llevó a esta nueva manera de pensar. Durante 
el siglo xv1 los matemáticos habían aprendido que las ecuaciones alge- 
braicas de tercero o cuarto grados podían resolverse por un proceso 
análogo al método elemental utilizado para resolver lás ecuaciones 
cuadráticas. Todos estos métodos tienen la siguiente característica 
común: las soluciones o «raíces» de la ecuación pueden escribirse como 
expresiones algebraicas, a: partir de los coeficientes de aquélla, me- 
diante una sucesión de operaciones, cada una de las cuales es una 
operación racional —adición, resta, multiplicación o división— o la 
extracción de una raíz cuadrada, cúbica o cuarta. Se dice que las 
ecuaciones algebraicas hasta las de cuarto grado pueden ser resueltas 
«por radicales» (radix es la palabra latina de raíz). Nada parece más 
natural que extender este procedimiento a las ecuaciones de grados 
quinto o superior, utilizando raíces de índice mayor, pero tales inten- 
tos fracasaron; incluso algunos distinguidos matemáticos del siglo xvin 
se engañaron creyendo que habían dado con la solución. Ya en los 
primeros años del siglo xıx el italiano Ruffini (1765-1822) y el genio 
noruego N. H. Abel (1802-1829) eoncibieron la entonces revoluciona- 
ria idea de probar la imposibilidad de resolver la ecuación algebraica 
general de-grado n por medio de radicales. 

Debe quedar completamente claro que la cuestión no reside en si 
cualquier ecuación algebraica de grado n posee soluciones; este hecho 
fué demostrado por vez primera por Gauss en su tesis doctoral en 1799. 
Así, pues, no hay duda acerca de la existencia de soluciones de una ecua- 
ción, especialmente desde que estas raíces pueden hallarse por proce- 
dimientos adecuados, con cualquier grado «de aproximación. El arte 
de la resolución númérica de las ecuaciones es, naturalmente, muy 
importante y está muy desarrollado; pero el problema de Abel y 
Ruffini es completamente distinto: ¿puede encontrarse la solución uti- 
lizando únicamente operaciones racionales y radicales? Fué el deseo de 
alcanzar claridad completa sobre esta cuestión lo que inspiró el mag- 
nífico desarrollo del álgebra moderna y de la teoría de grupos, ini- 
ciado por Ruffini, Abel y Galois (1811-1832). 

El problema de probar la imposibilidad de ciertas construcciones 
geométricas nos procura uno de los ejemplos más sencillos de esta 


INTRODUCCIÓN 129 


tendencia del álgebra. Mediante el uso de conceptos algebraicos po- 
dremos demostrar en este capítulo la imposibilidad de trisecar el án- 
gulo, de construir el heptágono regular, o de duplicar el cubo, con la 
sola ayuda de la regla y el compás. (El problema de la cuadratura del 
círculo es mucho más difícil de tratar; véase pág. 152). Nuestro punto 
de partida no será la cuestión negativa de la imposibilidad de ciertas 
construcciones, sino, por el contrario, la cuestión positiva de cómo 
pueden caracterizarse completamente todos los problemas construíbles. 
Después de haber contestado a esta cuestión, será tarea fácil pro- 
bar que los problemas mencionados caen fuera de“esta categoría. 

A los diecisiete años, Gauss investigó la constructibilidad de los 
«p-ágonos» regulares (polígonos de p lados), siendo p un número pri- 
mo. Sólo se conocía entonces la construcción para p=3 y p = 5; 
Gauss descubrió que el «p-ágono» regular era construtble si, y sólo si, 
p es un «número primo de Fermat»; es decir, 


p=2" +1; 


Los primeros números de Fermat son 3, 5, 17, 257, 65 537 (véase 
página 33). Tan entusiasmado se sintió el joven Gauss por su descu- 
brimiento, que renunció a su intención de hacerse filólogo y resolvió 
dedicar su vida a la matemática y sus aplicaciones. Siempre recordó 
la primera de sus grandes proezas con particular orgullo. Después de 
su muerte le fué erigida en Gotinga una estatua de bronce, y no pudo 
encontrarse honor más adecuado que el de dar a su pedestal la forma 
de un polígono regular de 17 lados. 

Cuando se trata de construcciones geométricas no hay que olvidar 
nunca que el problema no es el de dibujar figuras en la práctica: con 
cierto grado de exactitud, sino el de demostrar que sin otra ayuda 
que la regla y el compás la solución puede hallarse teóricamente, 
. suponiendo que nuestros instrumentos tienen precisión ideal. Lo que 
Gauss demostró es que sus construcciones pueden realizarse en prin- 
cipio. Su teoría nada tiene que ver con el método más sencillo de rea- 
lizarlas efectivamente o con los artificios que permitan simplificar y 
acortar el número de pasos necesarios; ésta es una cuestión de impor- 
tancia teórica mucho menor. Desde un punto de vista práctico, nin- 
guna construcción puede resultar tan satisfactoria como la que se 
obtiene mediante el uso de un buen trasportador de ángulos. El no 
entender adecuadamente el carácter teórico de la cuestión de las 
construcciones geométricas y la obstinación en querer desconocer los 
hechos científicos bien establecidos son responsables de la persis- 
tencia de los innumerables trisectores de ángulos y cuadradores de 
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círculos. Aquellos de entre éstos que sean capaces de entender las 
matemáticas elementales, pueden sacar provecho del estudio de. este 
capítulo. 

Una vez más recalcaremos que en algunas ocasiones nuestro con- 
cepto de construcción geométrica parece artificial. La regla y el com- 
pás son, ciertamente, los instrumentos más simples para dibujar; pero 
la restricción de utilizar exclusivamente estos instrumentos no es de 
forma alguna esencial en geometría. Como los matemáticos griegos 
sabían, tiempo ha, ciertos problemas -—tales como el de duplicar el 
cubo— pueden resolverse si se permite, p. ej., utilizar una regla en 
forma de ángulo recto; es bastante fácil idear instrumentos distintos 
del compás, por medio de los cuales es posible dibujar elipses, hipér- 
bolas y curvas mucho más complicadas, y cuyo uso amplía considera- 
- blemente el dominio de las figuras construibles. En los próximos pá- 
rrafos, sin embargo, seguiremos adheridos al concepto usual de cons- 
trucciónes geométricas mediante el uso exclusivo de la regla y el 
compás. l 


PARTE PRIMERA 
DEMOSTRACIONES DE IMPOSIBILIDAD Y ÁLGEBRA 


I. CONSTRUCCIONES GEOMÉTRICAS FUNDAMENTALES 


1. Construcción de cuerpos de números y extracción de raíces cua- 
dradas.—Para dar forma a nuestras ideas generales comenzaremos 
examinando algunas de las construcciones clásicas. La clave de una 
comprensión más profunda reside en trasladar los problemas geomé- 
tricos al lenguaje del álgebra. 

Todo problema de construcción geométrica es del siguiente tipo: 
se da cierto conjunto de segmentos rectilíneos, a, b, c, ... y se pide 
construir uno o más segmentos, x, y, ... Es siempre posible formular 
los problemas de este modo, aunque a primera vista tengan un aspecto 
muy diferente. Los segmentos requeridos pueden aparecer como lados 
de un triángulo a construir, como radios de círculos, o como coorde- 
nadas rectangulares de ciertos puntos (véase, p. ej., pág. 138). Por 
sencillez, supondremos que sólo se pide un segmento x. La construc- 
ción geométrica equivale entonces a resolver un problema algebraico; 
primero debemos hallar una relación (ecuación) entre la cantidad pe- 
dida x y las dadas a, b, c, ...; después hay que hallar la cantidad bus- 
cada x resolviendo esta ecuación, y, finalmente, debemos determinar 
si esta solución puede obtenerse mediante un proceso algebraico que 
corresponda a las construcciones con regla y compás. Éste es el prin- 
cipio de la geometría analítica: la caracterización cuantitativa de los 
objetos geométricos mediante números reales, basada en la introducción 
del continuo numérico real, que es el fundamento de toda la teoría. 

Observemos en primer lugar que algunas de las operaciones alge- 
braicas más sencillas corresponden a construcciones geométricas ele- 
mentales. Dados dos segmentos de longitudes a y b (medidos con un 
segmento «unidad» dado), es inmediato construir a + b, a — b, ra 
(donde r es cualquier número racional), a/b y ab. 

Para construir a + b (Fig. 27) trazamos una recta y llevamos con 
el compás las distancias OA =a y AB = b; entonces OB = a + b. 
Análogamente, para a — b, llevamos OA =a y AB = b; pero esta 
vez AB en sentido opuesto a OA; entonées OB = a —.b. Para cons- 
truir 3a sumamos simplemente a + a + a; de forma análoga, pode- 
mos construir pa, siendo p cualquier entero, Construiremos a/3 me- 
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diante el siguiente artificio (Fig. 28): llevamos OA = a. sobre una 
recta, y dibujamos una segunda recta por O. Sobre ésta llevamos un 
segmento arbitrario OC = c, y construímos OD = 3c. Unimos A con 
D, y trazamos desde C una recta paralela a AD, que corta a OA 
en B. Los triángulos OBC y OAD son semejantes; por tanto, OB/a= 
=0BJ/JOA = OC/OD = 1/3, y OB = af3. Del mismo modo podemos 
construir a/q, donde q es cualquier entero. Aplicando esta operación 
al segmento pa podemos construir ra, siendo r = p/q un número ra- 
cional cualquiera. 

Para construir a/b (Fig. 29) llevamos OB = b y OA = a sobre los 
lados de un ángulo O, y sobre OB llevamos OD = 1. Desde D traza- 


=== 8 
k— a —b— 
A 
a 7 a 
Tb by a a 
Fic. 27, —Construcción de a +b y de a—b. Fic. 28. — Construcción de aļ3. 
E la 





F1G. 29, — Construcción de ajb. Fia. 30, —Construcción de ab. 


mos una paralela a AB, que corta a OA en C. Entonces OC tendrá 
la longitud a/b. La construcción de ab se muestra en la figura 30, 
donde AD es una paralela a BC desde A. De estas consideraciones 
resulta que los procesos algebraicos «racionales»—adición, sustracción, 
multiplicación y división de cantidades conocidas —pueden efectuarse 
por medio de construcciones geométricas. A partir de segmentos dados, 
medidos por números reales a, b, c, ... podemos, por sucesivas. apli- 
caciones de estas sencillas construcciones, construir cualquier cantidad 
que sea expresable mediante a, b, c,... en forma racional; es decir, 
por medio de la aplicación reiterada' de adiciones, restas, multiplica- 
ciones y divisiones. La totalidad de las cantidades que pueden obte- 
nerse en esta forma a partir de a, b, c, ... constituye lo que se llama 
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un cuerpo de números, un conjunto de números-tal que toda opera- 
ción racional aplicada a dos o más miembros del conjunto da a su 
vez lugar a un número del conjunto. Recordemos que los números 
racionales, los números reales y los números complejos son ejemplos 
de cuerpos de números. En el caso presente, el cuerpo se dice engen- 
drado por los números dados a, b, c, ... 

La nueva construcción decisiva, que nos lleva fuera del cuerpo 
así obtenido, es la extracción de una raíz cuadrada; dado un seg- 
mento a, Ya puede también construirse utilizando sólo la regla y el 
compás. Sobre una recta llevamos OA =a y 
AB = 1 (Fig. 31). Trazamos una circunferen- 
cia con el segmento OB como diámetro y des- 
pués la perpendicular a OB desde A, la cual 
corta a la circunferencia en C. El triángulo 
OBC tiene un ángulo recto en C, ya que es 
sabido por geometría elemental que el ángulo FtS- 31.—Construcción 
inscrito en una semicircunferencia es recto. mee 





Luego OCA = ABC por ser semejantes los triángulos rectángulos 
OAC y CAB, y tenemos, para x = AC, 


a zx 
z 1 


, =a, z= va. 





2. Polígonos regulares.—Vamos a considerar ahora algunos pro- 
blemas de construcción algo más complicados. Comencemos por el 
decágono regular. Supongamos que un decágono regular está inscrito 
en un círculo de radio 1 (Fig. 32) y llamemos x a su lado. Dado que z 
subtiende un ángulo central de 36%, los otros dos ángulos del trián- 
gulo deben valer cada uno 720, y, por tanto, la recta de puntos que 
biseca al ángulo A divide al triángulo OA B en dos triángulos isósceles, 
cada uno con dos lados iguales de longitud zx. El radio del círculo se 
ha dividido así en dos segmentos, x y 1 — x. Por ser OAB semejante 
al triángulo isósceles menor se tiene 1/x = x/(1 — x). De esta pro- 
porción deducimos la ecuación cuadrática 1? + x — 1 = 0, una de 
cuyas soluciones es x = (4/5 — 1)/2. (La otra solución debe desecharse 
por ser negativa.) De esto resulta evidente que se puede construir x 
geométricamente. Teniendo la longitud x podemos ahora construir 
el decágono regular, llevando su longitud como cuerda del círculo. El 
pentágono regular puede obtenerse sin más que unir de dos en dos 
los vértices del decágono regular. 


Además de la construcción de „y 5 por el método de la figura 31, podemos 
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también obtenerlo como hipotenusa del triángulo rectángulo de catetos 1 y 2. 
Resulta v al restar la unidad de y 5 y dividir el resultado por 2. 


Los matemáticos griegos llamaban a la razón OB: AB del pro- 
blema precedente razón áurea, pues consideraban que un rectángulo 
cuyos lados estuviesen en esta relación era el más agradable estética- 
mente. Su valor, dicho sea de paso, es 1,62, aproximadamente. 


A 


ÓN, 


Fra, 32, —Decágono regular. Fra. 33. — Hexágono regular, 


De todos los polígonos regulares, el hexágono es el más sencillo de 
construir. Tracemos un círculo de radio r; la longitud del lado del 
hexágono regular inscrito en este círculo será entonces igual a r. El 
hexágono puede construirse llevando a partir de un punto de la cir- 
cunferencia cuerdas de longitud r hasta obtener los seis vértices. 

Del n-ágono régular podemos obtener el 2n-ágono regular bise- 
cando el arco subtendido en la circunferencia circunscrita por cada 
lado del n-ágono, utilizando también los puntos adicionales así obte- 
nidos como vértices originales del 2n-ágono pedido. Partiendo del diá- 
metro de la circunferencia (ó «2-ágono»), podemos, por tanto, cons- 
truir los polígonos de 4, 8, 16, ..., 21 lados. Análogamente, es posible 
obtener los de 12, 24, 48 lados, etc., a partir del hexágono, y los de 
20 y 40 lados, etc., partiendo del decágono. 


Si sa designa la longitud del lado del n-ágono regular inscrito en el círculo uni- 
dad (círculo de radio 1), entonces el lado del 2n-ágono regular tiene la longitud 


Sin == 2-Vi-a. 


Esto puede demostrarse como sigue: en la figura 34, sn es igual a DE = 2DC; 
sen = DB, y AB = 2. El área del triángulo rectángulo ABD es /4BD - AD = 
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=1/3AB - CD. Como AD = yAB!-— DB, sustituyendo AB = 2, BD = 89n, 
CD = 1/ssn, e igualando las dos expresiones del área, resulta 


Sn = $2n V 4 — Sn o sè = Sin (4 — s) 


Resolviendo esta ecuación cuadrática en z = Sn y Observando que x debe ser 
menor que 2, se llega fácilmente a la fórmula anterior. 


D 


Fic. 34. 


De esta fórmula y del hecho de que sa (lado del cuadrado) sea igual a y 2 
se deduce: 


s=vV 2- V2 se=V 2-24 V2 
MaN 2V aF aF VE eti: 


Como fórmula genńeral obtenemos para n > 2: 


mo V 2-V 24V 2+ VE 


que incluye n — 1 raíces cuadradas sucesivas. El perímetro del 22-ágono regular 
inscrito será 2759". Al tender n a infinito, el 22-ágono tiende a confundirse con la 
circunferencia, y, en consecuencia, 27sg2 tiende a la longitud de la circunferencia 
del círculo unidad, que por definición es 27. Obtenemos así, sustituyendo m por 
n — 1 y suprimiendo el factor 2, la fórmula asintótica para r: 





2m vV 2- Vay V 2+- + V2 > n cuando m—> o. 
-o A M 
m raíces cuadradas 


Ejercicio: Puesto que .2M -> oo demuéstrese que 


V 244/24- TD Sd o. 
E  —= E 
n raíces cuadradas ` 
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Los resultados obtenidos poseen el siguiente rasgo característico: 
Los lados del 2%-ágono, del 5 + 2%-dgono, y del 3 - 2d-ágono, pueden 
construirse mediante procesos de sumas, restas, productos, divisiones y 
extracciones de raices cuadradas. 

*3. Problema de Apolonio.—Otro problema de construcción, muy 
sencillo desde el punto de vista algebraico, es el famoso problema ya 
mencionado de los círculos tangentes de Apolonio. En lo que sigue 
no nos es necesario encontrar una construcción particularmente ele- 
gante; lo que importa es que, en principio, el problema pueda resol- 
verse con regla y compás solamente. Daremos una breve indicación 
de la demostración y más adelante (véase pág. 173) veremos un mé- 
todo constructivo más elegante. 

Supongamos que los centros de las circunferencias dadas tengan 
coordenadas (z1, Y1), (£2, Y2) y (%3, Ya), y radios rfi, r2 y rg, respectiva- 
mente. Designemos el centro y el radio del círculo pedido por (x, y) 
y r. Entonces, la condición para que dicho círculo sea tangente a los 
tres dados se obtiene observando que la distancia entre los centros de 
dos círculos tangentes es igual a la suma o diferencia de los radios, 
según que éstos sean tangentes exterior o interiormente. Esto nos da 
las ecuaciones: 


(z — x1)? + (Y — y)? — (r + r1)? = 0, (1) 
(x — x3)? + (y — ya)? — (r + r3)? = 0, [2] 
(1 — x3)? + (y — ya)? — (r + r3}? = 0, {3] 
o bien, 
z3 4 y? — r3 — 2221 — YY + 2ra +a par =O, [1a] 


etcétera. El signo + debe elegirse en cada una de estas ecuaciones 
según que las circunferencias sean tangentes exterior o interiormente 
(véase Fig. 35). Las ecuaciones [1], [2], [3], son cuadráticas con tres 
incógnitas, z, y, r, y en las tres los términos de segundo grado son 
los mismos, como se ve en la forma desarrollada [1 a]. Por tanto, res- 
tando [2] de [1], obtendremos una ecuación lineal en v, y, r 


ar + by + er = d, [4] 


donde a = 2(x3 — 11), etc. Análogamente, restando [3] de [1] tene- 
mos otra ecuación lineal, 


di+Dby+cr=d. [5] 


Resolviendo [4] y [5] respecto a x e y en función de r, y sustitu- 
yendo en [1], tendremos una ecuación cuadrática en r, que puede 
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resolverse por operaciones racionales y extracción de una raíz cuadrada 
(véase pág. 101). Habrá, en general, dos soluciones de esta ecuación, 
de las cuales sólo una es positiva. Después de determinar r mediante 
esta ecuación, obtendremos x e y de las dos ecuaciones lineales [4] 
y [5]. El círculo con centro (zx, y) y radio r será tangente a los tres 
círculos dados. En todo el proceso hemos usado sólo operaciones ra- 


OO 
T 


Fra, 35. — Circulos de Apolonio. 


cionales y extracciones de raíces cuadradas. Síguese de ello que r, x 
e y pueden ser construídos con regla y compás. 

Habrá, en general, ocho soluciones del problema de Apolonio, co- 
rrespondientes a las 2 - 2 - 2.-= 8 combinaciones posibles de los signos 
más y menos en las ecuaciones [1], [2] y [3]. Estas elecciones corres- 
ponden a las condiciones de que las circunferencias pedidas sean tan- 
gentes exterior o interiormente a cada uno de los tres círculos dados. 
Puede ocurrir que nuestro proceso algebraico no nos dé valores reales 
para zx, y y r. Esto sucederá, p. ej., si los tres círculos dados son con- 
céntricos, no existiendo entonces solución geométrica del problema. 
También cabe esperar posibles degeneraciones de la solución, como en 
el caso en que los tres círculos dados degeneren en tres puntos de una 
recta. Entonces, el círculo de Apolonio degenera en esta recta. No 
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discutiremos estas posibilidades con detalle; el lector con alguna expe- 
riencia de álgebra podrá completar el análisis. 


*II. NÚMEROS CONSTRUÍBLES Y CUERPOS DE NÚMEROS 


1. Teoría general.—En nuestra discusión previa queda indicado 
el fondo algebraico general de las construcciones geométricas. Cada 
construcción con regla y compás consiste en una sucesión de operacio- 
nes de las enumeradas a continuación: 1) unir dos puntos por una 
recta; 2) hallar el punto de intersección de dos rectas; 3) trazar una 
circunferencia de radio y centro dados; 4) hallar los puntos de inter- 
sección de una circunferencia con otra circunferencia o con una recta. 
Un elemento (punto, recta, circunferencia) se considera conocido si se 
da desde el principio o si ha sido construído en algún paso previo. 
Para un análisis teórico, podemos referir la construcción en conjunto 
a un sistema de coordenadas zx, y (véase pág. 82). Los elementos dados 
pueden representarse por puntos a segmentos en el plano x, y. Si sólo 
se da un segmento inicial, podemos tomarlo como unidad de longitud, 
lo que determina el punto x = 1, y = 0. A veces, aparecen elementos 
«arbitrarios»: se trazan líneas arbitrarias, se eligen puntos o radios 
arbitrarios. (Un ejemplo de elemento arbitrario aparece al construir 
el punto medio de un segmento: dibujamos dos circunferencias de ra- 
dios iguales, pero arbitrarios, con sus centros en los extremos del 
segmento, y unimos sus intersecciones.) En tales casos, elegimos el 
elemento de manera que sea racional; es decir, los puntos arbitrarios, 
con coordenadas v, y racionales; las rectas arbitrarias ar+dy+c=0, 
con coeficientes a, b, c racionales; los círculos arbitrarios, con centros 
de coordenadas racionales y radios racionales. Haremos siempre la 
elección de los elementos arbitrarios de manera que sean racionales; 
si los elementos son verdaderamente arbitrarios, esta restricción no 
puede afectar al resultado de la construcción. 

Por sencillez, supondremos en la siguiente discusión que sólo se 
da un elemento inicial, -el segmento de longitud 1. Según $ I podemos 
construir con regla y compás todos los números que puedan deducirse 
de la unidad mediante procesos racionales de suma, resta, multipli- 
cación y división; es decir, todos los números racionales r/s, siendo 
r y s enteros. El sistema de los números racionales es «cerrado» res- 
pecto a las operaciones racionales; esto es, la suma, diferencia, pro- 
ducto o cociente de dos números racionales—excluyendo, como siem- 
pre, la división por cero—es también un número racional. Todo con- 
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junto de números que posea esta propiedad de ser cerrado respecto 
a las cuatro operaciones, se denomina cuerpo de números. 


Ejercicio: Demuéstrese que todo cuerpo contiene al menos todos los números 
racionales. (Indicación: Si a Æ 0 es un número del cuerpo F, entonces a/a = 1 
pertenece a F, y a partir de 1 se obtiene todo número racional por operaciones 
racionales.) 


Partiendo de la unidad, podemos construir el cuerpo completo de 
los números racionales y, en consecuencia, todos los puntos racionales 
(es decir, los puntos con ambas coordenadas racionales) del plano 
x, Y. Podemos obtener nuevos números, irracionales, haciendo uso del 
compás para construir, p. ej., el número 4/2, que, como sabemos 
por el capítulo II, $ II, no pertenece al cuerpo racional. Habiendo 
construído y/2 mediante las construcciones «racionales» de $ I, po- 
demos hallar todos los números.de la forma 


a+ovV2, 0) 


siendo a y b racionales y, por tanto, construíbles. También podemos 
construir todos los números de la forma 


a+ Va, (a+ 01 2)c+dV 2), 

ec+dv2 

donde a, b, c y d son racionales. Por otra parte, estos números pueden 
escribirse en la forma (1); en efecto: 


a+o1V2 a+bV2 e-dvV2 


ac — 2bd de — ad 
= e3 — 2d? + c? — 2d? V2= 


p+9V2, 

siendo p y q racionales. (El denominador c? — 2d? no puede ser cero, 
pues si c2 — 2d? = 0, entonces 4/2 = cjd, lo que contradice la de- 
mostrada irracionalidad de 4/2.) Igualmente 


(a +b V2) (e +d V?) = (ac + 2bd) + (be +a W2=r+svV 2, 


siendo r y s racionales. De aquí que todo cuanto podemos obtener 
con la construcción de y/2 es el conjunto de números de la forma [1], 
siendo a y b racionales y arbitrarios. 
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Ejerelcio: Siendo p = 1 + Y2, q=2-— y2, r= —3 + v? pónganse bajo 
la forma [1] los números 





Pp q PE PHA 
— 2 — p)—, —, — 
ARPA ras ara 


Estos números [1] forman un cuerpo, como muestra la discusión 
precedente. (Es obvio que la suma y diferencia de dos números de 
la forma (1] tiene también la misma forma.) Este cuerpo es más amplio 
que el cuerpo racional, que es una parte o subcuerpo de él. Pero, natu- 
ralmente, es menos amplio que el cuerpo de todos los números reales. 
Llamemos al cuerpo racional Fo, y al nuevo cuerpo de números de 
la forma [1], F¡. La posibilidad de construir cualquier número del 
«cuerpo ampliado» F, ha sido ya establecida. Podemos ahora exten- 
der el alcance de nuestras construcciones, p. ej., tomando un número 
de F,, tal como k = 1 + y2, y extrayendo la raíz cuadrada; obtene- 
mos así el número construíble 


y con él, de acuerdo con $ I, el cuerpo formado por todos los números 
p+aVk, [21 


donde ahora p y q son números arbitrarios de Fy; es decir, de la forma 
a +b y2, con a, b de Fo, esto es, racionales. 


Ejercicio: Represéntense en la forma [2] los números 


1 EN a ASY 
14V VaVk+ a+Vha-VA(Va+ 72) 


14Vk (Vks-3 1+ V2k 


Todos estos números han sido construídos en la hipótesis de un solo segmento 
dado inicialmente. Si se dan dos, elegiremos uno de ellos como unidad de longitud, 
y supondremos que la longitud del otro segmento medido con esta unidad es «. 
Entonces podemos construir el cuerpo G formado por todos los números de la forma 


(V k), 


dama? + am-14™-1 + +++ + aja + ao 
bnan + bp 1an14 +e +b10 + do 


donde los números ag, * * * , dm Y do, * * * , Òn son racionales, y m y n enteros positivos. 


Ejercielo: Dados los segmentos de longitudes 1 y a, constrúyase 1 + a + «al, 
(1 + 0/(1 — a), a3. 
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Supongamos ahora, con mayor generalidad, que somos capaces de 
construir todos los números de un cuerpo F. Vamos a demostrar que 
el uso de la regla sola no nos permitirá salir fuera del cuerpo F. La 
ecuación de la recta que une los puntos de coordenadas a, bı y az, bz, 
pertenecientes a F, es (bı — ba) x + (az — a) y + (axbz — azb) = 0 
(véase pág. 501); sus coeficientes son expresiones racionales formadas 
por números de F, y, por definición de cuerpo, también pertenecen a F. 
Además, si tenemos dos rectas ar+By—y=0 y «'x+ß'y—y' =0, con 
coeficientes de F, las coordenadas de su punto de intersección, halla- 
das resolviendo este sistema de dos ecuaciones, son: 


y'= BY _ ay 
ag” Es Ba’ y ap” a Ba’ 





Como éstos son también números de F, es evidente que el uso de la 
regla sola no nos permitirá salir fuera de los confines del: cuerpo F. 


Ejercicios: Las rectas r + y2y—1=0, 2x — y + y2=0, tienen coefi- 
cientes del cuerpo [1]. Calcúlense las coordenadas de su punto de intersección, y 
verifíquese que tienen la forma [1]. 

Unanse los puntos (1, V2) y (y 2, 1 — y?) mediante la recta ar + by + e = 0 
y verifíquese que los coeficientes son de la forma (1]. 

Hágase lo mismo respecto al cuerpo [2] para las rectas. 


Vi+V22+V2y=1,1+VDr-y=1-V1+vV2, 
y los puntos (4/2, —1), (1 + 4/2, V 1 + Y 2), respectivamente. 


Sólo podemos salir de los confines de F' haciendo uso del compás. 
Para conseguir esto, elegimos un elemento k de F tal que yk no 
pertenezca a F. Entonces podemos construir yk y, por tanto, todos 
los números 

a+oV k, 13) 


donde a y b son racionales, o incluso elementos arbitrarios de F. La 

suma y diferencia de dos números a + b Vk y c + d yk, su producto, 

(a + b yk) (c + d vk) = (ac + kbd) + (ad + bc) yk, y su cociente, 
a+oWVKk (a+5VkMe-dVKk)  ac—kbd  be-ad JE 


c+aVk c3 — kd? c3 — kd? * c3 — kd? 


son de nuevo de la forma p + q yk, siendo p y q de F. (El denomi- 
nador c? — kd? no puede anularse, salvo que c y d sean ambos cero; 
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en caso contrario yk = ċjd, sería un número de F, mientras hemos 
supuesto que y/k no pertenecía a F.) Luego el conjunto de números 
de la forma a+b yk forma un cuerpo F’, que contiene el cuerpo 
original F, pues podemos, en particular, elegir b = 0. F’ se llama 
cuerpo generalizado o extensión de F, y F subcuerpo de F'. 

Como ejemplo, sea F el cuerpo a + b y2, con a y b racionales 
y k = y2. Entonces, los números del cuerpo generalizado F’ se re- 
presentan por p + q 4/2, siendo p y q de F, p = a + b v3, q = «' + 
+b 4/2, con a, b, a' y b’ racionales. Todo número de F’ puede ser 
reducido a esta forma; p. ej., 


1 vVi-vV3 v3- vi 
Vii VI VDV VI 2-V2 





VA VE VEA VD RVD 
O 4-2 4-2 


A 4 
=1+V2-(1+ Ya 2) V 2. 


Ejercicio: Sea F el cuerpo p+qV2+ y 2, donde p y q son de la forma 
a+by2, y a y b racionales. Represéntese en esa forma el número 


14 V2+vV2 
2-34 24 V2 


Hemos visto que si partimos de un cuerpo F de números construí- 
bles que contiene el número k, entonces, por medio de la regla y una 
única utilización del compás podemos construir yk y, en consecuen- 
cia, todos los números de la forma a + by/k, en tanto que a y b 
sean de F. 

Recíprocamente, probaremos ahora que, mediante una sola apli- 
cación del compás, podemos obtener sólo números de esta forma. Pues 
lo que el compás realiza en una construcción és definir puntos (o sus 
coordenadas) como intersecciones de una circunferencia y una recta, 
o de dos circunferencias. La circunferencia de centro E, y y radio r 
tiene como ecuación (x — E)? + (y — n} = r?; luego si E, y y r per- 
tenecen a F, la ecuación podrá escribirse en la forma: 


z? + y? + 2ax + 28y + Y =0, 
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con coeficientes a, B y y de F. Una recta ar + by + c = 0, que une 
dos puntos cuyas coordenadas están en F, tiene coeficientes a, b, c 
de F, como ya hemos visto (pág. 141). Eliminando y entre estas dos 
ecuaciones obtenemos para la abscisa x de un punto de intersección 
de la circunferencia y la recta una ecuación cuadrática de la forma 
Ax? + Bx + C = 0, cuyos coeficientes A, B, C, de F, son A = al +b?, 
B = 2ac + bla — abB), C = c2 — 2bcg + by. La solución viene 
dada por la fórmula 


— B+ VB?-4AC 


2A 





que es de la forma p + q yk, con p, q, k de F. Una fórmula análoga 
nos da la ordenada y del punto de intersección. 
Por otra parte, si tenemos dos circunferencias: 


T? + y? + 2ax + 2By + y=0, 
z3 + y3 + 20% + 28y + y'= O, 


restando la segunda ecuación de la primera, obtenemos la ecuación 
lineal 


La — a) + XB — By + (Y~ 1) =0, 


que puede resolverse junto con la ecuación de la primera circunfe- 
rencia, como antes. En uno y otro caso, la construcción da las coorde- 
nadas x e y del punto o de los dos nuevos puntos, y estas cantidades 
son de la forma p +.q vk, con p, q, k de F. En particular, natural- 
mente, Vk puede pertenecer a F; p. ej., cuando sea k = 4, Entonces 
la construcción no proporciona nada esencialmente nuevo, y no sali- 
mos de F. Pero éste no es el caso general. 


Ejercicio: Considérese el círculo de radio 2/2 con centro en el origen, y la 
recta que une.los puntos (1/2,0), (442, v 2). Hállese el cuerpo F’ determinado 
por las coordenadas de los puntos de intersección de la circunferencia y la recta. 
Hágase lo mismo respecto de la intersección de la circunferencia dada con la de 
radio y 2/2 y centro (0, 2v2). 


Resumiendo otra vez: dadas ciertas cantidades iniciales, podemos 
construir sólo con la regla todas las cantidades del cuerpo F engen- 
drado mediante procesos racionales a partir de las cantidades dadas. 
Utilizando el compás, es posible extender el cuerpo F de las cantida- 
des construíbles a un cuerpo más amplio, eligiendo un número k de F, 
extrayendo su raíz cuadrada y construyendo el cuerpo F’ formado 
por todos los números de la forma a + b vV k, donde a y b son de F. 
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Éste es un subcuerpo de F’, porque todas las cantidades de F están 
también contenidas en F”, ya que en la expresión a + b y/'k podemos 
elegir b = 0. (Se supone que y/k es un nuevo número no pertene- 
ciente a F, pues de otro modo el proceso de adjunción de yk no haría 
variar la situación, y F’ sería idéntico a F.) Hemos probado que todo 
paso en una construcción geométrica (trazado de la recta que une 
dos puntos, de la circunferencia de centro y radio dados, o determi- 
nación de la intersección de dos rectas o circunferencia conocidas) 
puede, bien producir cantidades del cuerpo ya conocido o, mediante 
la construcción de una raíz cuadrada, dar lugar a un nuevo cuerpo 
ampliado de números construibles. 

La totalidad de los números construíbles puede ser descrita ahora 
con precisión. Partimos de un cuerpo dado Fo, definido por cantidades 
iniciales dadas; .p. ej., el cuerpo de todos los números racionales, si 
sólo se da un segmento, elegido como unidad. A continuación, me- 
diante la adjunción de y/ko, donde ko es de Fo, pero no ko, formamos 
el cuerpo ampliado F, de números construíbles, que consta de todos 
los números de la forma ao + do Vko, en que ao y bo son números 
cualesquiera de Fo. Después se define Fo, nueva extensión de F), 
como conjunto de todos los números de la forma a, + bı ki, siendo 
as y bı números de F}, y k un número de F, cuya raíz cuadrada no 
está en F. Repitiendo este proceso, podemos obtener un cuerpo Fn 
después de n adjunciones de raíces cuadradas. Números construibles 
son aquellos y sólo aquellos que pueden hallarse mediante una tal suce- 
sión de cuerpos ampliados, esto es, que pertenecen a un cuerpo Fn del 
tipo descrito. La magnitud del número n de extensiones necesarias no 
importa; sólo mediría el grado de complejidad del problema. 

El siguiente ejemplo puede aclarar el proceso. Deseamos obtener 


el número 
Ve VU V VIVE +V3+5. 


Sea Fy el cuerpo de los números racionales. Hagamos ko = 2, ob- 
teniendo el cuerpo F}, que contiene el número 1 + 4/2. Ahora toma- 
mos kı = 1 + y2 y kə = 3. Por supuesto, 3 está en el cuerpo origi- 
nal Fo, y a fortiori en el cuerpo Fz, por lo cual es perfectamente lícito 
elegir ka = 3. Luego tomamos ks = Y 1 + V2 + y3, y, finalmente, 


ka =4/ V1+ 12 + v3 +5. El cuerpo Fs así construído contiene 


el número deseado, pues y/6 está a su vez en Fs, ya que y2 y v3, y 
en consecuencia su producto, están en Fg y también, por tanto, en Fs. 
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Ejercicios: Verifíquese que, partiendo del cuerpo racional, el lado del 2m-á4gono 
regular (véase pág. 135) es un número construíble, con n = m — 1. Determínese 
la sucesión de cuerpos generalizados. Hágase lo mismo con los números 


Vi+V2+V3+V5, (13 + VID/A + 17-V3), 
VIEVDWV a+ VWVi+V2+V58+13-vV0. 


2. Todos los números construíbles son algebraicos.—Si el cuerpo Fo, inicial, 
es el cuerpo racional engendrado por un único segmento, entonces todos los nú- 
meros construíbles son algebraicos (véase pág. 112). Los números del cuerpo Fi 
son raíces de ecuaciones cuadráticas, los de Fs, raíces de ecuaciones de cuarto 
grado, y, en general, los números de Fx son raíces de ecuaciones de grado 2k, 
con coeficientes racionales. Para probar esto para el cuerpo F3, consideremos como 


ejemplo z = y2 + V 3 + Y 2. Tenemos (1— y2)3=34+Yy2; 214 2-— 
— 2y Žr = 3 + y2, ó z? — 1 = y2 (22 + 1), ecuación cuadrática con coefl- 
cientes del cuerpo Fı. Si elevamos al cuadrado, obtenemos finalmente 


(22 — 1)! = 227 + 1), 


que es una ecuación de cuarto grado con coeficientes racionales. 
En general, todo número del cuerpo F3 tendrá la forma 


z= p + gV, [4]. 


donde p, q y w pertenecen al cuerpo F, y, por ello, son de la forma p = a+by s, 
q=c+ dy s, w = e + fy s, siendo a, b, c, d, e, f y s racionales. De (4) tenemos 


z3 — 2px + p?=q%, 


cuyos coeficientes pertenecen todos al cuerpo F1, engendrado por ys. Por tanto, 
esta ecuación puede escribirse en la forma 


x3 + uz +v = Vs(r+0, 


siendo r, 3, t, u y v racionales. Elevando al cuadrado ambos miembros, obtenemos 
una ecuación de cuarto grado 


(12 + uz + v)? = s(rx + 1)? [5] 
con coeficientes racionales, según queríamos wer. 


Ejercicios: 1. Hállense ecuaciones con coeficientes racionales para: 


a) 12=V2+V3; b2=vy2+vV3 c) 1=1/V5+ V3. 


2. Hállense por métodos análogos ecuaciones de octavo grado para: 
a) Var vV2+vV2 b) 2=y24+4V14+V3 0) 2=1+ 
MU 54+V3+ 2. 
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Para demostrar el teorema general si z es un cuerpo Fx con k arbitrario, pro- 
baríamos, mediante el procedimiento usado antes, que x satisface a una ecuación 
cuadrática con coeficientes de Fx-1. Repitiendo este procedimiento encontraríamos 
que z satisface a una ecuación de grado 2? = 4 con coeficientes de Fyx-2, etc. 

Ejercicio: Complétese por inducción la demostración general para probar que 
x satisface a una ecuación de grado 2? con coeficientes de Fx-;, siendo, 0 < l < k. 
Este enunciado para | = k es el teorema deseado. 


*ITHI. IRRESOLUBILIDAD DE LOS TRES PROBLEMAS GRIEGOS 


1. Duplicación del cubo.—Estamos ahora en condiciones de inves- 
tigar los viejos problemas de trisección del ángulo, duplicación del 
cubo y construcción del heptágono regular. Comenzaremos por el pri- 
mero; si se da un cubo cuya arista es la unidad de longitud, su' volu- 
men será la unidad de volumen; se desea encontrar la arista x de un 
cubo cuyo volumen sea el doble. Dicha arista satisfará a la sencilla 
ecuación cúbica: 


13-2=0. ni] 


Nuestra demostración de que el número x no puede construirse 
con regla y compás es indirecta. Supondremos de momento que tal 
construcción es posible. Según lo dicho antes, esto significa que zx 
pertenece a algún cuerpo Fx deducido, como ya se vió, del cuerpo 
racional, mediante sucesivas ampliaciones obtenidas por adjunción de 
raíces cuadradas. Como veremos, esta hipótesis nos lleva a una con- 
secuencia absurda. 

Sabemos ya que x no pertenece al cuerpo racional Fo, pues Y2 
es un número irracional (Ej. 1, pág. 69). Luego x puede pertenecer 
sólo a algún cuerpo Fx, siendo k un entero positivo. Podemos supo- 
ner que k es el menor número entero positivo tal que x esté en algún 
Fx. Resulta entonces que x puede escribirse en la forma 


=p+qVvw, 


donde p, q y w pertenecen a algún Fx-1, pero y/w no. A continuación, 
mediante un simple pero importante tipo de razonamiento algebraico, 
probaremos que si x = p + q yw es una solución de la ecuación cú- 
bica [1], entonces y = p — q vw es también solución. Como x está 
en el cuerpo Fx, también x3 y 13 — 2 estarán en Fx, y tendremos 


13-2-:a+bVw. 121 
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en donde a y b pertenecen a Fx.¡. Mediante un sencillo cálculo re- 
sulta a = p? + 3pq2w — 2, b = 3p%4 + q4w. Si hacemos 


y=p-qVv, 
y sustituiímos q por —q en estas expresiones de a y b, vemos que 
y—-2=a-bVw. [2] 
Supongamos ahora que x es raíz de qì — 2 = 0, y, por tanto, 
a+ bV w=0. [3] 


Esto implica—y aquí está la clave del argumento—que a y b son 
iguales a cero. Pues si b no fuera cero, podríamos deducir de [3] que 
Vw = —ajb, y yw sería un número del cuerpo Fx-ı al que pertene- 
cen a y b, contrariamente a nuestra hipótesis. Siendo, pues, b = 0, se 
sigue inmediatamente de [3] que también a = 0. 

Una vez visto que a = b = 0, es consecuencia inmediata de [2”] 
que y = p — q yw es también solución de la ecuación cúbica (1], por 
ser y3 — 2 = 0. Además, y 4 1; es decir, zx — y %0, pues xt — y = 
= 29 Vw sólo puede anularse si q = 0, de donde x = p pertenecería 
a Fr-1, contra lo supuesto. 

Hemos probado así que si x = p + q yw es una solución de la 
ecuación cúbica [1], también y = p — q yw es otra solución diferente 
de esta ecuación, lo que entraña una evidente contradicción, pues hay 
un único número real x que es raíz cúbica de 2, siendo las otras dos 
raíces cúbicas imaginarias (véase pág. 107); y = p — q Vw es, sin em- 
bargo, real, ya que p, q, y yw son reales. 

La hipótesis hecha nos ha llevado a un absurdo, quedando así 
demostrada su falsedad. Una solución de [1] no puede estar en el 
cuerpo Fg; es decir, es imposible duplicar el cubo con regla y compás. 

2. Un teorema sobre ecuaciones cúbicas.—El razonamiento alge- 
braico que acabamos de utilizar ha sido adaptado especialmente al 
problema particular analizado. Si deseamos ocuparnos de los otros dos 
problemas clásicos, es preferible proceder sobre una base más general. 
Los tres problemas dependen algébricamente de ecuaciones cúbicas. 
Un hecho fundamental concerniente a la ecuación cúbica 


z3 + az? +bz+4c¢c=0 4) 


es la relación siguiente entre las tres raíces £, Ta, za de la 
misma: 
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Tı + T3 + Za = —a *. [5] 


Consideremos la ecuación cúbica [4] con coeficientes a, b, c, racio- 
nales. Puede suceder que una de las raíces de la ecuación sea racional; 
p. ej., la ecuación 18 — 1 = 0 tiene la raíz racional 1, mientras que las 
otras dos raíces, dadas por la ecuación cuadrática 12 -+ x + 1 = 0, 
son necesariamente imaginarias. Pero podemos demostrar fácilmente 
el siguiente teorema general: Si una ecuación cúbica de coeficientes 
racionales no tiene raiz racional, ninguna de sus raíces es construíble 
partiendo del cuerpo racional Fo. 

Daremos nuevamente una demostración por reducción al absurdo. 
Supongamos que zx fuera una raíz construíble de [4]. Entonces x per- 
tenecería al último cuerpo Fx de alguna cadena de cuerpos sucesiva- 
mente ampliados Fo, Fi; ... Fx, como antes. Supondremos que k es el 
menor entero tal que una raíz de la ecuación cúbica [4] pertenece 
a Fx. Por supuesto que k debe ser mayor que cero, ya que en el enun- 
ciado del teorema se supone que ninguna raíz x pertenece al cuerpo 
racional Fo; luego x puede escribirse en la forma 


r=p+qvuw, 


donde p, q, w pertenecen al cuerpo precedente Fy-1, pero yiw no. 
Sigue de ello, exactamente como para la ecuación particular z3—2=0 
anterior, que otro número de Fy, 


y=p-qVv, 


será también solución de la ecuación [4]. Como antes, podremos ver 


que q 4 0 y, por tanto, t +Æ y. 
De [5] resulta que la tercera raíz de la ecuación [4] está dada por 
u = —a — a — y. Pero, dado que x + y = 2p, esto significa que 


= — a — 2p, 


y como yw ha desaparecido, u es un número del cuerpo Fr.1. Esto 

contradice la hipótesis de que k es el menor número. tal que algún Fx 

contiene a una raíz de [4]; en consecuencia, la hipótesis es absurda, y 

* El polinomio z? + az? + bz + e puede descomponerse en el producto (z — 21) 

(z — x3) (Z — zs), siendo xı, xs, zs las raíces de la ecuación [4] (véase pág. 110). Por tanto, 
z3 + azt + bz + c = z2 — (tı + £s + 2a)2? + (2103 + 2,La + T323)? — T13, 

y como el coeficiente de cada potencia debe ser el mismo en ambos miembros, resulta; 


—a = Tı + T: + 2» b = tixs + Xi%a + T323, —C = T2423. 
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ninguna raíz de [4] pertenece a ningún cuerpo Fx. El teorema gene- 
ral está demostrado. Basándose en este teorema quedará probada la 
imposibilidad de una construcción .con regla y compás si el equiva- 
lente algebraico del problema resulta ser solución de una ecuación 
cúbica desprovista de raíces racionales. Esta equivalencia es obvia 
para el problema de duplicar el cubo, y vamos a establecerla para los 
otros dos problemas griegos. 

3. Trisección del ángulo.—Vamos a demostrar que la trisección 
del ángulo con la regla y el compás es, en general, imposible. Natural- 
mente, existen ángulos como los de 900 y 1800, para los cuales es 
posible la trisección. Lo que vamos a demostrar es que la trisección 
no puede efectuarse por un método válido para todo ángulo. Para ello 
basta considerar un ángulo que no pueda trisecarse, ya que un método 
general debería ser válido para cualquier ejemplo. Por consiguiente, 
la no existencia de un método general puede probarse si se demuestra 
que el ángulo de 600, p. ej., no puede ser trisecado sólo con el auxilio 
de la regla y el compás. 

Podemos obtener un equivalente algebraico de este problema de 
diferentes formas; la más sencilla consiste en considerar el ángulo 
por su coseno: cos O = g. Entonces, el problema es el de encontrar 
la cantidad x = cos (0/3). Mediante una sencilla fórmula trigonomé- 
trica (véase pág. 106) el coseno de 0/3 se halla ligado con el de 0 por 
la ecuación 

cos O = g = 4 cos3 (0/3) — 3 cos (0/3). 


En otras palabras, el problema de trisecar el ángulo 0, con cos 9=g, 
equivale a construir una solución de la ecuación cúbica 


4z? — 3z — g = 0. [6] 
Para probar que en general no puede hacerse esto, tomemos 0=60°, 
de donde g = cos 60° = 1/2, y la ecuación [6] se convierte en 
823 — 6z = 1. 17] 


En virtud del teorema antes demostrado, basta probar que esta 
ecuación no tiene raíz racional. Haciendo v = 2z, la ecuación se trans- 
forma en 

v3 — 30 = 1. {8] 


Si hubiera un número racional v = r/s que verificara esta ecuación 
(r y s primos entre sí), tendríamos r3 — 3s?r = s3; de donde si = 
= r(r? — 3s?) sería divisible por r, y r y s tendrían un factor común, 
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a menos que r = + 1. Asimismo, s? divide a r3 = s2 (s + 3r), lo que 
supone que r y s tienen algún factor común, salvo que s = +1. Como 
hemos supuesto que s y r carecen de factor común, vemos que los 
únicos números racionales que pueden verificar la ecuación [8] son 
+1 ó —1. Pero sustituyendo +1 y —1 en lugar de v en [8] vemos 
que ninguno de ambos la satisface; luego [8] y, en consecuencia, (7] 
carecen de raíz racional, y la imposibilidad de trisecar el ángulo que- 
da demostrada. 


Este teorema de que un ángulo no puede ser trisecado con regla y compás 
sólo es cierto cuando la regla se usa exclusivamente como instrumento para trazar 
la recta determinada por dos puntos. En nuestra caracterización general de los 
números construíbles, el uso de la regla se ha limitado siempre a esta operación; 
si se permiten otros usos de la regla, la totalidad de las construcciones posibles 
puede extenderse enormemente. El siguiente método para trisecar el ángulo, utili- 





A o 
FtG. 36.— Trisección de un ángulo (Arquimedes). 


zado en las obras de Arquímedes, es un buen ejemplo. Sea x un ángulo arbitrario 
dado, como en la figura 36. Prolonguemos la base del ángulo por la izquierda y 
tracemos un semicírculo con centro en 0 y radio arbitrario r. Señalemos dos pun- 
tos A y B en el borde de la regla, tales que AB = r. Manteniendo el punto B en 
la semicircunferencia, deslicemos la regla haciendo que A caiga sobre la prolon- 
gación del lado inicial del ángulo x, mientras el borde de la regla pasa por la in- 
tersección C del segundo lado del ángulo x con la semicircunferencia de centro O. 
Con la regla en esta posición tracemos una recta, que forma un ángulo y con la 
prolongación del lado inicial del ángulo z. 
Ejercicio: Demuéstrese que esta construcción nos da y = 2/3. 


4. El heptágono regular.—Vamos a considerar ahora el problema 
de hallar el lado z de un heptágono regular inscrito en la circunferen- 
cia unidad. La forma más sencilla de tratar este problema es utilizar 
los números complejos (Cap. II, V); sabemos que los vértices del hep- 
tágono están dados por las raíces de la ecuación 


z —1=0, (9) 


siendo las coordenadas z, y de los vértices las partes real e imaginaria 
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del número complejo z = x + yi. Una solución de esta ecuación es 
z = 1, y las otras son las raíces de la ecuación 


z7 —1 





z2] 57 +z +z +z34+2z2?+z4+1=0, [10] 
obtenida de [9] dividiendo por el factor z — 1 (pág. 108). Dividiendo 
[10] por 23, obtenemos la ecuación 


z3 + 1/23 4 224 1/24 2+1/24+1=0. (11) 


Mediante una sencilla transformación algebraica, podemos escri- 
bir [11] en la forma: 


(2 + 1/23 — 3Uz + 1/2) + (2 + 1/22 — 2 + (24 1/3 +1=0. 112] 
Designando z + 1/z por y, de [12] deducimos: 
y3 + y? — 2y —1=0. (13] 
Sabemos que z, raíz séptima de la unidad, está dada por 


z = COS p + ¡sen q, (14] 


donde p = 3600/7 es el ángulo central subtendido por el lado del hep- 
tágono regular; asimismo sabemos (Ej. 2, pág. 106) que 1/z = cos p— 
— isen q; es decir, y = z + 1/z = 2 cos q. 

Si es posible construir y, podremos también construir cos p, y reci- 
procamente. Luego si podemos probar que y no es construíble, que- 
dará al mismo tiempo probado que z, y, por tanto, el heptágono, no 
es construíble. De esta forma, en virtud del teorema antes demos- 
trado, queda solamente por probar que la ecuación [13] no tiene raí- 
ces racionales. Esto también será probado por reducción al absurdo, 
Supongamos que (13] tiene una raíz racional r/s (r y.s primos entre 
sí). Tenemos 

r3 + r?s — 2rs? — $3 = (; (15] 


donde se ve como antes que 13 es divisible por s, y s3 por r. Como s y r 
son primos entre sí, cada uno debe ser igual a +1; por tanto, si y es 
racional, sólo puede tomar los valores +1 y —1. Sustituyendo estos 
números en la ecuación, vemos que ninguno de ellos la satisface. 
Luego y, y por ende el heptágono regular, no es construíble. 

5. Observaciones acerca de la cuadratura del círculo.—Hemos lo- 
grado tratar estos problemas de duplicar el cubo, trisecar el ángulo 
y construir el heptágono regular, mediante métodos relativamente 
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elementales. El problema de la cuadratura del círculo es mucho más 
difícil y requiere la técnica del análisis matemático superior. Como 
un círculo de radio r tiene área zr?, el problema de construir un cua- 
drado de área igual a la de un círculo de radio unidad equivale a la 
construcción de un segmento de longitud yx, lado del cuadrado pe- 
dido. Este segmento será construíble si, y sólo si, el número m es 
construíble. En virtud de nuestra caracterización general de los nú- 
meros construíbles, podemos demostrar la imposibilidad de cuadrar 
el círculo probando que el número m no puede estar contenido en 
ningún cuerpo Fx que pueda deducirse del cuerpo racional Fọ me- 
diante sucesivas adjunciones de raíces cuadradas. Como todos los ele- 
mentos de tal cuerpo son números algebraicos, es decir, números que 
satisfacen a ecuaciones algebraicas de coeficientes enteros, nos basta 
con probar que el número v no es algebraico; es decir, que es trascen- 
dente (véase pág. 112). 

La técnica necesaria para establecer que m es un número trascen- 
dente fué creada por Charles Hermite (1822-1905), quien demostró 
. que el número e es trascendente. Mediante un ligero perfecciona- 
miento del método de Hermite, F. Lindemann consiguió (1882) pro- 
bar la trascendencia de x, poniendo fin para siempre a la vieja cues- 
tión de la cuadratura del círculo. La demostración está al alcance del 
estudiante de análisis superior, pero excede los fines de este libro. 


PARTE SEGUNDA 
VARIOS MÉTODOS PARA OBTENER CONSTRUCCIONES 


IV. TRANSFORMACIONES GEOMÉTRICAS. INVERSIÓN 


1. Observaciones generales.—En la segunda parte de este capí- 
tulo vamos a discutir de forma sistemática algunos principios generales 
que pueden aplicarse a los problemas de construcción. Muchos de 
estos problemas pueden dominarse con más claridad desde el punto 
de vista general de las «transformaciones geométricas» en lugar de 
estudiar una construcción particular, vamos a considerar simultánea- 
mente la totalidad de los problemas ligados por ciertos procesos de 
transformación. El poder de síntesis aclaratoria del concepto de clase 
de transformaciones geométricas no está en modo alguno restringido 
a los problemas de construcción, sino que afecta a casi toda la geome- 
tría. En los capítulos IV y V nos ocuparemos de este aspecto general 
de las transformaciones geométricas, limitándonos ahora a estudiar 
un tipo particular de transformación: la inversión respecto a una cir- 
cunferencia del plano, que es una generalización de la simetría ordi- 
naria respecto a una recta. KOS 

Por transformación o representación del plano en sí mismo enten- 
demos una ley que asigna a cada punto P del plano otro punto P’, 
llamado imagen de P en la transformación; el punto P se llama ante- 
cedente de P', Un ejemplo sencillo de tal transformación es la sime- 
tría del plano respecto de una recta L, como en un espejo; un punto P, 
situado a un lado de L, tiene como imagen el punto P’ del otro lado 
de L, y tal que L es la mediatriz del segmento PP”. Una transforma- 
ción puede dejar fijos ciertos puntos del plano; en el caso de la sime- 
tría, esto ocurre para los puntos de L. 





AL 
S 


Fic. 37.—Simetría de un punto Fic. 38.— Inversión de un punto 
respecto a una recta. respecto a una circunferencia, 
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Otros ejemplos de transformaciones son: las rotaciones del plano 
alrededor de un punto fijo O; las traslaciones paralelas, que trasladan 
cada punto una distancia d en una dirección dada (tales transforma- 
ciones no dejan puntos fijos); y, más en general, los movimientos rigi- 
dos del plano, que pueden imaginarse como compuestos de rotaciones 
y traslaciones paralelas. 

La clase particular de transformaciones que ahora nos interesa es 
la de las inversiones respecto a circunferencias. (Algunas veces llama- 
das reflexiones circulares, debido a que representan con cierta aproxi- 
mación la relación entre el objeto y la imagen en una reflexión sobre 
un espejo circular.) En un plano dado, sea C una circunferencia de 
centro O (llamado centro de la inversión) y radio r. Definimos como 
imagen del punto P, el punto P’ de la recta OP, situado del mismo 
lado de O que P, y tal que cumple la condición 


OP - OP =r? 11) 


Los puntos P y P’ se denominan puntos inversos respecto a C. De 
esta definición concluímos que si P’ es el punto inverso de P, a su vez 
P es el inverso de P’. Una inversión intercambia el interior y el exte- 
rior del círculo C, ya que para OP < r tenemos OP" > r, y para 
OP > r, OP’ <r. Los únicos puntos del plano que quedan fijos en 
la inversión son los puntos de la circunferencia C. 

La regla [1] no define una imagen para el centro O. Es evidente 
que si un punto P móvil lo aproxi- 
mamos a O, la imagen P’ se aleja 
cada vez más en el plano. Por esta 
razón decimos a veces que O corres- 
ponde al punto del infinito en la in- 
versión. La utilidad de esta forma de 
hablar reside en el hecho de permitir- 
nos asegurar que una inversión esta- 
blece una correspondencia entre los 
puntos del plano y sus imágenes, que 

es biunívoca sin excepción: cada punto 
e ircunterencia, del plano tiene una imagen y sólo 

una, y él mismo es imagen de un 
punto y sólo uno. Todas las transformaciones consideradas anterior- 
mente gozan de esta propiedad. 

2. Propiedades de la inversión.—La propiedad más importante de 
la inversión es la de que transforma rectas y circunferencias en rectas 
y circunferencias. Con más precisión, vamos a ver que en una inversión: 
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a) Una recta que pasa por O se transforma en una recta que 
pasa por O. 

b) Una recta que no pasa por O se transforma en una circunfe- 
rencia que pasa por O. 

c) Una circunferencia que pasa por O se transforma en una recta 
que no pasa por O. 

d) Una circunferencia que no pasa por O se transforma en una 
circunferencia que no pasa por O. 

La proposición a) es obvia, ya que por definición de inversión 
todo punto de la recta tiene como imagen otro punto de la misma; es 
decir, que aunque los puntos de la recta se intercambian, la recta 
como totalidad se transforma en sí misma. 

Para probar b) tracemos una perpendicular desde O a la recta L 
(Fig. 39). Sea A el punto donde esta perpendicular corta a L, y A' 





FG. 40.— Inversión de una circunferencia. 


el inverso de A. Tomemos un punto cualquiera P de L, y sea P’ su 
inverso. Como OA’ + OA = OP” + OP = RP, resulta que 


0A'/0P' = OP/OA. 


Por tanto, los triángulos OP'A* y OAP son semejantes y el ángulo 
OP'A' es recto. Por geometría elemental sabemos que P’ está en la 
circunferencia K de diámetro OA”, de donde la inversa de L es esta 
circunferencia. Esto prueba b). La proposición c) se demuestra por el 
hecho de que si K es la inversa de L, la inversa de K es L. 

Queda por demostrar la proposición d). Sea K una circunferencia 
que no pasa por O, de centro M y radio k. Para obtener su imagen, 
tracemos una recta por O que corte a K en A y B, y veamos cómo 
varían las imágenes A* y B’ cuando la recta que pasa por O corta a 
K de todas las formas posibles. Designemos las distancias OA, OB, 
04”, OB', OM por a, b, a', b', m, y sea t la longitud de la tangente 
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a K desde O. Tenemos aa' = bb' = r?, por definición de inversión, y 
ab = f?, por una propiedad geométrica elemental del círculo. Si divi- 
dimos las primeras relaciones por la segunda, resulta 


ab = dla = r?2/t2 = e?, 


donde c? es una constante que depende sólo de r y t, y es la misma 
para todas las posiciones de A y B. Por A” trazamos una paralela a BM 
que corta a OM en Q. Sea OQ = q, y A'Q = p; entonces q/m = a'/b = 
= p/k, o sea 

q = ma'/b = me?, p = kal/b = ke?. 


Esto significa que para todas las posiciones de A y B, Q será 
siempre el mismo punto de OM, y la distancia A'Q tendrá siempre el 
mismo valor. Además, B'Q = p, 
ya que a'/b = b'/a, Así, las imáge- 
nes de todos los puntos A, B, de 
K, son puntos cuyas distancias a Q 
son iguales a p; es decir, la imagen 
de K es una circunferencia. Esto 
prueba d). 

3. Construcción geométrica de 
puntos inversos.—El siguiente teo- 
rema nos será útil en el párrafo 
FiG. 41.—Inversión de un punto exterior próximo: El punto P’, inverso de 

respecto a una circunferencia. - un punto dado P respecto a una 

circunferencia C, puede ser cons- 
truído geométricamente mediante el solo uso del compás. Consideremos 
primero el caso en que el punto dado P sea exterior a C. Con OP 
como radio y centro en P describimos un arco que corte a C en los 
puntos R y S. Con estos dos puntos como centros describimos arcos 
de radio r que se cortan en O y en el punto P’ de la recta OP. En los 
triángulos isósceles ORP y ORP' se verifica 





AP a PT 
ORP = POR = OP'R, 
luego estos triángulos son semejantes, y se tiene: 


oE OR t OP: 0P’ 2 
OR = op"? esto es, = r?, 
El punto P’ así construído es, por tanto, el inverso de P. 
Si el punto dado P es interior a C, subsiste la misma construcción, 


siempre que la circunferencia de radio OP y centro P corte a C en 
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dos puntos. Si no la corta, podemos reducir la construcción del punto 
inverso P’ al caso anterior mediante el siguiente artificio: 

Observemos primero que con el solo uso del compás podemos en- 
contrar un punto C de la recta que une dos puntos dados A, O, y 
tal que AO = OC. Para esto, tracemos una circunferencia de centro 
O y radio r = OA, y llevemos sobre esta circunferencia a partir de A, 
los puntos P, Q, C, tales que AP = PQ = QC = r. Entonces C es el 
punto deseado, como se ve por el hecho de que los triángulos AOP, 
OPQ, OQC son equiláteros; es decir, OA y OC forman un ángulo 
de 1809, y OC = OQ = AO. Repitiendo este procedimiento, podemos 
fácilmente prolongar AO un número deseado de veces. Incidental- 
mente, como la longitud del segmento AQ es rq/3, como el lector 
puede verificar fácilmente, hemos construído al mismo tiempo y3, 
a partir de la unidad, sin utilizar la regla. 

Podemos ahora encontrar el inverso de un punto P interior a la 
circunferencia C. Primero hallaremos un punto R de la recta OP 
cuya distancia a O sea un múltiplo entero de OP y que quede exte- 
rior a C; es decir, 


OR =n-0P. 


Podemos hacer esto llevando sucesivamente la distancia OP: con 
el compás hasta salir fuera de C. Hallamos ahora el punto R’ inverso 
del R, mediante la construcción antes dada. Entonces, 


rè =OR': OR = OR - (n + OP) = (n - OR”): OP. 


Por tanto, P’, tal que OP’ = n - OR', es el punto inverso buscado. 


P Q 
R P 
A 0 Cc 
FiG. 42.—Duplicación de Fic. 43.— Inversión de un punto interior 
un segmento, respecto a una circunferencia. 


4. Forma de hallar sólo con el compás el punto medio de un seg- 
mento y el centro de una circunferencia.—Habiendo aprendido ya a 
determinar el inverso de un punto dado mediante el uso exclusivo del 





COURANT.—7 
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compás, podemos realizar algunas construcciones interesantes; p. ej., 
consideremos el problema de encontrar el punto medio entre dos pun- 
tos A y B, utilizando solamente el compás (¡sin trazar rectas!). He 
aquí la solución: tracemos la circunferencia de radio AB y centro B, 
y llevemos tres arcos de radio AB, a partir de A. El punto final C 
estará en la recta AB, siendo AB = BC. Dibujemos ahora la circun- 
ferencia de radio A B y centro A, y sea C' el punto inverso de C respecto 
a este círculo. Entonces: AC’ - AC = AB?; o sea, AC' - 2AB = A R, 
y 2AC' = AB; por tanto, C’ es el punto medio pedido. 

Otra construcción con compás, que hace uso de puntos inversos, 
es la de hallar el centro de una circunferencia dada. Elegimos un 
punto P de la circunferencia y con centro en él trazamos otra circun- 





B C 
Fic. 44.—Determinación del punto Fra. 45,—Determinación del centro 
medio de un segmento. de un círculo. f 


ferencia que corte a la dada en los puntos R y S. Con estos centros 
trazamos arcos de radios RP = SP, que se cortan en Q. Comparando 
con la figura 41, vemos que el centro desconocido Q’ es inverso de Q 
respecto al círculo de centro P, por lo que Q’ puede ser construído 
haciendo sólo uso del compás. 


V. CONSTRUCCIONES CON OTROS INSTRUMENTOS. 
CONSTRUCCIONES DE MASCHERONI CON COMPÁS SOLAMENTE 


*1. Una construcción clásica para duplicar el cubo.—Hasta aquí 
hemos considerado únicamente problemas de construcciones geomé- 
tricas con regla y compás. Cuando se permiten otros instrumentos, la 
variedad de las construcciones posibles se hace naturalmente más ex- 
tensa; p. ej., los griegos resolvían el problema de duplicar el cubo de 
la forma siguiente: consideremos (Fig. 46) un ángulo recto rígido 
MZN y una cruz movible en ángulo recto B, VW, PQ. Dos varillas 
adicionales RS y TU pueden deslizarse perpendicularmente a los lados 
del ángulo recto. En la cruz se eligen dos puntos fijos E y G, de tal 
forma que GB = a y BE = f tengan longitudes prefijadas. Situando 
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la cruz de modo que los puntos E y G estén sobre NZ y MZ, respec- 
tivamente, y deslizando las varillas TU y RS, podemos llevar el apa- 
rato entero a una posición en que tengamos el rectángulo ADEZ, por 
cuyos vértices A, D, E, pasan los brazos BW, BQ, BV de la cruz. 
Tal disposición es siempre posible, si f > a. Vemos entonces que 
a:r=xw:y=y:f; de donde, si f es igual a 2a en el aparato, resulta 





N 
N 


FıG. 46.—Instrumento para duplicar el cubo. 


13 = 2a3; por tanto, x es la arista de un cubo cuyo volumen es doble del 
cubo de arista a. Tenemos así resuelto el problema de duplicar el cubo. 

2. Restricción de usar sólo el compás. —Resulta natural que si se 
permite una mayor variedad de instrumentos podamos resolver una 
colección más amplia de problemas de construcción, y cabe esperar 
que a una mayor restricción de instrumentos corresponda una clase 
más restringida también de las construcciones posibles; por ello, fué 
un descubrimiento sorprendente, debido al italiano Mascheroni (1750- 
1800), el de que todas las construcciones geométricas posibles mediante 
la regla y el compás pueden hacerse sólo con el compds. Naturalmente, 
no se puede trazar la recta que une dos puntos sin la regla, por lo 
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que esta construcción fundamental no está en realidad comprendida en 
la teoría de Mascheroni. En cambio, puede suponerse que la recta está 
dada por dos de sus puntos. Mediante el uso del compás solo, se puede 
encontrar el punto de intersección de dos rectas dadas de este modo, 
como también las intersecciones de una circunferencia dada con una 
recta. 

Quizá el ejemplo más sencillo de construcción de Mascheroni sea el 
de duplicar un segmento dado AB. La solución fué dada en la pági- 
na 157, y en la siguiente hemos determinado el punto medio de un 
segmento. Vamos ahora a resolver el problema de bisecar un arco AB 
de una circunferencia de centro dado O. La construcción es la si- 

guiente: desde A y B como centros tra- 
£ zamos dos arcos, de radio A0; a partir 
de O, llevamos los arcos OP y OQ igua- 
les a AB. A continuación, dibujamos dos 


arcos de radios PB A y centros P 
ES y QA y y 


Q, que se cortan en R. Finalmente, con 
A radio OR, describimos un arco con cen- 
KOA A tro en P o Q hasta cortar a A B; el punto 
de intersección es el punto medio bus- 
cado del arco AB. Dejamos la demostra- 
ción como ejercicio al lector. 

Sería imposible demostrar el teorema general de Mascheroni dando 
la construcción con campás solo para cada construcción posible con 
regla y compás, ya que el número de éstas no es finito. Sin embargo, 
podemos lograr el mismo objeto demostrando que cada una de las 
cuatro construcciones fundamentales siguientes es posible con el 
compás solo; 

1) Trazar una circunferencia de centro y radio dados. 

2) Hallar los puntos de intersección de dos circunferencias. 

3) Hallar los puntos de intersección de una recta y una circun- 
ferencia. 

4) Hallar el punto de intersección de dos rectas. 

Toda construcción geométrica en el sentido usual, cuando se per- 
mite el uso de regla y compás, consiste en una sucesión finita de estas 
construcciones elementales. Las dos primeras son evidentemente posi- 
bles con compás solo. Las soluciones de los problemas más difíciles 
3 y 4 dependen de las propiedades de la inversión desarrollada en la 
sección precedente. 

Resolvamos el problema 3, consistente en hallar los puntos de 
intersección de una circunferencia C y una recta, dada por los puntos 


Flia. 47.—Bisección de un arco 
con el compás. 


SEC. v] CONSTRUCCIONES CON OTROS INSTRUMENTOS 161 


A y B. Con centros A y B y radios A0 y BO, respectivamente, dibu- 
jemos dos arcos, que se cortarán de nuevo en P. Determinemos ahora 
el punto Q inverso de P respecto a C, mediante la construcción con 
compás solo dada en la página 157. Tracemos la circunferencia de 
centro Q y radio QO (que debe cortar a C); los puntos de intersección 
X y X' de esta circunferencia con la dada, C, son los dos puntos bus- 
cados. Para probarlo necesitamos solamente demostrar que X y X' 
son equidistantes de O y P, ya que A y Blo son por construcción. Esto 
resulta del hecho de que el inverso de Q es un punto cuya distancia 
a X y X' es igual al radio de C (pág. 157). Observemos que la circun- 
Q 


O — — 
A x x 
B, 
e — — — er 
C c B, 
Fic, 48.—Intersección de una circunfe- Fic. 49.—Intersección de una circunfe- 
rencia con una recta que no pasa por rencia con una recta que pasa por su 
f su centro, centro. 


ferencia que pasa por X, X’ y O es inversa de la recta AB, ya que 
ésta y la circunferencia deben cortar a C en los mismos puntos. (Los 
puntos de la circunferencia son inversos de sí mismos.) 

La construcción deja de ser válida sólo en el caso de que la recta 
AB pase por el centro de C. Pero entonces los puntos de intersección 
pueden determinarse mediante la construcción dada en la página 160,- 
como puntos medios de arcos de C, obtenidos trazando con centro 
en B una circunferencia arbitraria que corte a C en B, y Ba. 

El método para determinar la circunferencia inversa de la recta 
que une dos puntos dados permite una solución inmediata del pro- 
blema 4. Sean dos rectas dadas AB y A'B' (Fig. 50). Tracemos una 
circunferencia cualquiera C del plano y, mediante el método prece- 
dente, hallemos las circunferencias inversas de AB y A'B’, las cuales 
se cortan en O y en el punto Y. El punto X, inverso del Y, es el punto 
pedido, y puede construirse mediante el procedimiento ya dado. Que 
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X es el punto buscado es evidente por el hecho de que Y es el único 
punto con la propiedad de ser a la vez inverso de un punto de AB 


l 
27 
I 
/ 
ON 


FIG. 50.—Intersección de dos rec- 
tas. 


y de A'B'; luego el punto X, inverso 
del Y, debe estar en AB y A'B'. 

Con estas dos construcciones hemos 
completado la demostración de equiva- 
lencia entre las construcciones de Mas- 
cheroni sólo con el compás, y las cons- 
trucciones geométricas usuales con regla 
y compás. No nos hemos cuidado de dar 
soluciones elegantes para cada problema 
particular, ya que nuestro objeto ha sido 
más bien el de penetrar en el fondo ge- 
neral de las construcciones de Masche- 


roni. Vamos a dar como ejemplo, sin embargo, las construcción del 
pentágono regular; con más precisión, vamos a hallar cinco puntos de 


una circunferencia que 
sean vértices de un pen- 
tágono regular inscrito. 

Sea A un punto de 
la circunferencia dada 
K. El lado del hexágo- 
no regular “inscrito es 
igual al radio de K, por 
lo que podemos hallar 
los puntos B, C, D so- 
bre K, tales que ÁB= 
=BC=CD=600 (figu- 
ra 51). Con A y D 
como centros y radio 
AC, tracemos dos arcos 
que se cortarán en X., 
Entonces, si es O el 
centro de K, un arco de 
centro A y radio OX 
cortará a K en el punto 


K 


Fic. 51.—Construcción del pentágono regular. 


medio F de BC (véase pág. 160). Ahora, con el radio de K, tra- 
cemos un arco con centro en F, que encuentra a K en G y H. Sea 
Y un punto cuya distancia a G y H es OX, y que está separado de 
X por O. Entonces A Y será igual al lado del pentágono buscado. La 
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demostración se deja como ejercicio al lector. Observemos que se 
han utilizado en la construcción solamente tres radios diferentes. 

En 1928, el matemático danés Hjelmslev halló, en una librería de 
Copenhague, un libro llamado Euclides Danicus, publicado en 1672 
por un oscuro autor, G. Mohr. Del título podría inferirse que este tra- 
bajo era simplemente una versión o comentario de los Elementos de 
Euclides. Pero cuando Hjelmslev examinó el libro se sorprendió al 
encontrar que contenía esencialmente el problema de Mascheroni y su 
solución completa, encontrada antes que Mascheroni. 


Ejercicios: He aquí la descripción de las construcciones de Mohr. Confróntese 
su validez. ¿Por qué resuelven el problema de Mascheroni? - 

1. Sobre un segmento AB de longitud p trácese un segmento perpendicular 
BC. (Solución: prolónguese AB hasta un punto D, tal que AB = BD. Trácense 
circunferencias arbitrarias con centros A y D, determinando así C.) 

2. Dados dos segmentos de longitudes p y q tales que p > q, hállese un seg- 
mento de longitud z = y p? — q*, haciendo uso de 1. 

3. Dado un segmento a, constrúyase el segmento ay 2. [Obsérvese que 
(ay 2)? = (ay 3)? — a2.) 

4. Con dos segmentos dados, p y q, hállese un segmento z = y p? + ql. 
[Utilicese la relación x2 = 2p? — (p?— q2).] Háganse otras construcciones similares. 

5. Utilizando los resultados anteriores, constrúyanse segmentos de longitudes 
P +4 y p — q, Supuestos dados en el plano los segmentos de longitudes p y q. 

6. Compruébese y demuéstrese la siguiente construcción para el punto medio 
M de un segmento dado AB de longitud a. En la prolongación de AB constrú- 
yanse C y D tales que CA = AB = BD. Trácese el triángulo isósceles ECD con 
EC = ED = 2a, y hállese M como intersección de dos circunferencias de diá- 
metros EC y ED. 

7. Hállese la proyección ortogonal de un punto A sobre la recta BC. 

8. Constrúyase x tal que x :a = p:q, si a, p, q son segmentos dados. 

9. Haállese x = ab, sia y b son segmentos dados. 





Inspirado por Mascheroni, Jacob Steiner (1796-1863) trató de uti- 
lizar sólo como instrumento la regla en lugar del compás. Natural- 
mente, la regla sola no puede llevarnos fuera de un cuerpo de números 
dado, por lo cual no basta para todos las construcciones geométricas 
en el sentido clásico. Lo notable es que Steiner fué capaz de restringir 
el uso del compás a una sola aplicación. Demostró que todas las cons- 
trucciones en el plano que son posibles con regla y compás pueden 
hacerse sólo con la regla, siempre que se suponga dada una circunfe- 
rencia fija, y su centro. Estas construcciones requieren métodos pro- 
yectivos y serán indicadas más adelante (véase Cap. IV, pág. 209). 


* Esta circunferencia y su centro son imprescindibles; p. ej., si se da un círculo, 
pero no su centro, es imposible construir este último mediante la regla sola. Para 
demostrarlo hay que hacer uso de un resultado que será discutido más adelante 
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(Cap. IV, pág. 232). Existe una transformación del plano en sí mismo que tiene 
las siguientes propiedades: a) el círculo dado queda fijo en la transformación; 
b) toda recta se transforma en recta; c) el centro del círculo se transforma en algún 
otro punto. La mera existencia de tal transformación prueba la imposibilidad de' 
contruir cor la regla sola el centro de un círculo dado. Pues si la construcción 
fuera posible, consistiría en dibujar un cierto número de rectas y determinar sus 
intersecciones, entre sí, y con la circunferencia dada. Ahora bien: si a la figura 
total, formada por la circunferencia dada y todos los puntos y rectas de la cons- 
trucción, se le aplica la transformación cuya existencia hemos supuesto, la figura 
transformada satisfará todas las exigencias de la construcción, pero dará como 
resultado un punto distinto del centro del círculo, Por tanto, tal construcción es 
imposible. 


3. Trazado con instrumentos mecánicos. Curvas mecánicas. Cicloi- 
dos.—Ideando mecanismos para dibujar curvas distintas de la circun- 
ferencia y de la recta, podemos ampliar el «dominio de las figuras 
construíbles; p. ej., si tenemos un instrumento para trazar las hipér- 
bolas xy = k, y otro para dibujar las parábolas y = ax? + bx + c, 
entonces todo problema que conduzca a la ecuación cúbica 


ax? + br? + cx = k, [1] 


puede ser resuelto por construcción, utilizando sólo estos instrumentos. 
Pues si hacemos 


zy = k, y = ax? + brz + c, 12] 


resolver [1] equivale a resolver el sistema de ecuaciones [2] por elimi- 
nación de y; es decir, las soluciones de [1] son las abscisas x de los 
puntos de intersección de la hipérbola y la parábola de [2]. Así, las 
soluciones de [1] podrían construirse si dispusiéramos de instrumentos 
para dibujar la parábola y la hipérbola de las ecuaciones [2]. 

Desde la antigüedad, los matemáticos sabían que muchas curvas 
interesantes podían ser definidas y dibujadas mediante sencillos ins- 
trumentos mecánicos. De estas «curvas mecánicas» las cicloides son de 
las más notables. Tolomeo (200 a. de J. C.) las utilizó en forma muy 
ingeniosa para describir los movimientos de los planetas del sistema 
solar. 

La cicloide más sencilla es la curva descrita por un punto fijo de 
la. circunferencia de un círculo cuando rueda sin deslizar sobre una 
recta. La figura 53 nos muestra cuatro posiciones del punto P del 
círculo rodante. El aspecto general de la cicloide es el de una serie de 
arcos que se ápoyan sobre la recta. Pueden obtenerse variaciones de 
esta curva eligiendo el punto P, ya en el interior del círculo (como en 
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Flia. 52.—Solución gráfica de una ecuación cúbica. 


un rayo de una rueda), ya en la prolongación de.un radio (como en el 
reborde de la rueda de un tren). La figura 54 muestra estas dos 
curvas. 

Se obtiene otra variante de la cicloide haciendo rodar la circunfe- 
rencia, no sobre una recta, sino sobre otra circunferencia. Si el círculo 
rodante c, de radio r, es tangente interiormente al círculo mayor C, 





Fria. 53.—La cicloíide. 
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de radio R, el lugar engendrado por un punto fijo de la circunferen- 
cia c se llama hipocicloide. 

Si el círculo c describe la circunferencia entera de C una vez, el 
punto P retornará a su posición original sólo si el radio de C es un 


am m am 
er” 





Fra. 54.—Cicloides generales. 


múltiplo entero del de c. La figura 55 muestra el caso en que R = 3r. 
Con mayor generalidad, si el radio de C es m/n veces el de c, la hipo- 
cicloide se cerrará al cabo de n circuitos alrededor de C, y constará 
de m arcos. Un caso especial interesante se presenta si R = 2r. Todo 


Fia. 55.—Hipocicloide de tres retrocesos. 


punto P del círculo interior describe un diámetro del círculo mayor 
(Fig. 56). Proponemos como problema al lector la demostración de 
esta propiedad. 

Aún puede engendrarse otro tipo de cicloide por medio de un 
círculo que rueda sobre otro fijo, permaneciendo tangente exterior- 
mente a éste. Tal curva se llama epicicloide. 
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Fic, 56.—Movimiento rectilineo por medio de puntos de un 
círculo que rueda sobre un circulo de radio doble. 


*4. Conexiones. Inversores de Peaucellier y de Hart.—Dejaremos 
por ahora el tema de las cicloides (que aparecerán nuevamente en un 
lugar inesperado) y estudiaremos otros métodos de engendrar curvas. 
Los instrumentos mecánicos más sencillos para trazar curvas son las 
conexiones. Una conexión consiste en un conjunto de varillas rígidas 
unidas de alguna manera mediante articulaciones móviles, de forma 
que el sistema total tenga suficiente libertad como para permitir a un 
punto del mismo describir una cierta curva. El compás es realmente 
una simple conexión, que consiste en principio en una varilla única 
fijada por un punto. 

Las conexiones se han utilizado desde hace mucho tiempo en la 
construcción de máquinas. Uno de los ejemplos históricos famosos, el 
«paralelogramo de Watt», fué ideado por James Watt para resolver 
el problema de unir el pistón de su máquina de vapor con un punto 
de un volante, de forma que la rotación del volante hiciese mover el 
pistón en línea recta. La solución de Watt es sólo aproximada, y pese 
a los esfuerzos de muchos matemáticos distinguidos, el problema de 
construir una conexión que haga mover un punto precisamente en 
línea recta continuaba sin resolver. En un tiempo, cuando las demos- 
traciones de irresolubilidad de ciertos problemas atraían enormemente 
la atención, fué formulada la conjetura de que la construcción de tal 
conexión era imposible. Fué por ello una gran sorpresa cuando, en 1864, 
un oficial naval francés, Peaucellier, inventó una sencilla conexión que 
resolvía el problema. Con la introducción de lubricantes eficaces, el 
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problema técnico para las máquinas de vapor había perdido entonces 


su importancia. 
El propósito de la conexión de Peaucellier es el de convertir un 


(OJ EZZ 





Fra. 57.—Movimiento rectilineo transformado en rotación, 


movimiento circular en rectilíneo. Está basado en la teoría de la 
inversión discutida en las páginas 153-57. Como se ve en la figura 58, 
la conexión consta de siete varillas rígidas; dos de longitud t,. cuatro 
de longitud s, y la séptima de longitud arbitraria. O y R son dos pun- 





FIG. 58.—Transtormación de Peaucellier de la rotación en movimiento rectilíneo. 


tos fijos, situados de modo que. OR = PR. El aparato entero puede 
moverse sujeto a las condiciones dadas. Vamos a demostrar que si P 
describe una circunferencia de centro R con radio PR, Q describe un 
segmento de recta. Designando el pie de la perpendicular de Sa PQ 
por T, observemos que 
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OP - 0Q = (OT — PT)(OT-+ PT) = OT? — PT? 
= (OT? + ST?) — (PT? + ST?) 
= (1 — s?, 


La cantidad 1? — s2 es una constante que llamaremos r?. Como 
OP + OQ = r?, P y Q son puntos inversos respecto a la circunferencia 
de radio r y centro O. Cuando P describe una trayectoria circular 
(que pasa por O), Q describe la curva inversa de la circunferencia, la 
cual es una recta, pues hemos visto que lá inversa de una circunfe- 
rencia que pasa por O ' 
es una recta. La trayec- 
toria de Q es, por tanto, 
una recta, que se traza 
sin hacer uso de la re- 
gla. Otra conexión que 
resuelve el mismo pro- 
blema es el inversor de 
Hart. Este consta de 
cinco varillas unidas 
como indica la figura 59. 
Aquí AB=CD, BC= Fra. 59.—Inversor de Hart. 
=AD. 0, P y Q son 
puntos fijos de las varillas AB, AD y CB, respectivamente, tales que 
AOJOB = AP|PD = CQ/QB = min. Los puntos O y S son fijos, de 
forma que OS = PS, mientras que el resto del aparato puede moverse 
libremente. Es evidente que AC es constantemente paralela a BD; 
por tanto, O, P y Q son siempre colineales y OP es paralela a AC. 
Tracemos AE y CF perpendiculares a BD; tenemos: 





AC - BD = EF: BD = (ED + EB)(ED — EB) = ED! — EBS3, 
Pero ED? + AE? = AD?, y EB? + AE? = AB?. Por tanto, ED? — EB? = 
= AD? — A B?. Ahora bien: 
OP/BD = AO/AB = m/f(m + n) y OQ/AC = OB/AB = n/(m + n). 


En consecuencia, 


OP ; OQ = [mn/(m + n)3] BD - AC = [mn/(m + n)?] (AD? — AB3). 


Esta cantidad es la misma para todas las posiciones posibles de 
la conexión; por tanto, P y Q son puntos inversos respecto a cierta 
circunferencia de centro O. Cuando al aparato se mueve, P describe 
una circunferencia de centro S y que pasa por O, mientras su inverso Q 
describe una recta, 
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Pueden construirse otras conexiones (por lo menos en principio), 
para trazar elipses, hipérbolas, y, en general, toda curva dada por 
una ecuación algebraica f(x, y) = 0 de cualquier grado. 


VI. COMPLEMENTOS SOBRE INVERSIÓN Y SUS APLICACIONES 


1. Invariancis de ángulos. Haces de círculos.—Aunque la inver- 
sión respecto de una circunferencia cambia la forma de las figuras 
geométricas, es un hecho notable el que las nuevas figuras continúen 
poseyendo muchas de las propiedades de las figuras primitivas. Éstas 
son las propiedades que no cambian, o «invariantes» de la transfor- 
mación. Como ya sabemos, la inversión transforma rectas y circun- 
ferencias en rectas y circunferencias; añadiremos ahora otra propiedad 
importante: el ángulo entre dos rectas o curvas es invariante en la inver- 
sión. Con esto queremos decir que dos curvas secantes se transforman 
por una inversión en otras dos curvas que se cortan bajo el mismo 
ángulo. Por ángulo entre dos curvas entendemos, naturalmente, el 
ángulo formado por sus tangentes. 

La demostración puede estudiarse en la figura 60, que ilustra el 
caso especial de una curva C que corta a una recta OL en un punto P. 
La inversa C’ de C corta a OL en el punto inverso P’, el cual, como 





Fria, 60.— Conservación de los ángulos en la inversión. 
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OL es su propia inversa, está en OL. Demostraremos que el ángulo xo 
entre OL y la tangente a C en P es igual en magnitud al ángulo 
correspondiente yo. 

Para ello elegimos un punto A de la curva C próximo al P, y tra- 
zamos la secante AP. El inverso de Á es un punto A” que, per estar 
a la vez en la recta OA y en la curva C’, debe coincidir con su inter- 
sección. Dibujemos la secante A'P”. Por definición de inversión, 


rè = OP ` OP’ =0A: OA’, 


OP OA 
OA OP’ 


es decir, los triángulos OA P y OA’ P’ son semejantes. Por consiguien- 
te, el ángulo x es igual al OA’P’, que llamaremos y. La etapa final 
consiste en hacer mover el punto A sobre C, aproximándolo al P; 
esto obliga a la secante AP a girar hasta la posición de la tangente 
a la curva C en P, mientras el ángulo x tiende al zo. Al mismo tiempo 
A” se aproxima a P’, y A'P' gira hasta la posición de la tangente 
a C' en P’; el ángulo y tiende al yọ. Como z e y son iguales en cual-- 
quier posición de A, tendremos en el límite: Tọ = po. 

Nuestra demostración queda incompleta, sin embargo, pues he- 
mos considerado sólo el caso de una curva que corta a una recta que 
pasa por O. El caso general de dos curvas C y C*, que forman un án- 
gulo z en P, es ahora fácil de estudiar. Es evidente que la recta OPP’ 
divide a z en dos ángulos, cada uno de los cuales se conserva en la 
inversión. 


Debe observarse que aunque la inversión conserva la magnitud de los ángulos, 
invierte su sentido; es decir, si un rayo por P describe el ángulo xo en sentido 
contrario al de las agujas del reloj, su imagen recorrerá el ángulo po en el sen- 
tido opuesto. 


Una consecuencia particular de la invariancia de los ángulos en la 
inversión es que si dos circunferencias o curvas son. ortogonales (es 
decir, se cortan en ángulo recto), continúan siendo ortogonales des- 
pués de la inversión, mientras que dos curvas tangentes (es decir, que 
forman ángulo nulo) quedan tangentes. 

Consideremos la familia de todas las circunferencias que pasan por 
el centro de inversión O y por otro punto fijo A del plano. Por lo 
dicho en la página 155, sabemos que esta familia de circunferencias 
se transformará en un haz de rectas que pasan por 4”. Las circunfe- 
rencias ortogonales a las primeras se transforman en circunferencias 
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ortogonales a las rectas del haz A”, como se ve en la figura 61. (Las 
circunferencias ortogonales están dibujadas de trazos). El aspecto sen- 
cillo del haz de rectas resulta muy diferente del de la familia de cir- 





Fic. 61.—Haces de círculos ortogonales relacionados por inversión. 


cunferencias, pese a que vemos que están íntimamente relacionados, 
pues, en efecto, desde el punto de vista de la inversión, son por com- 
pleto equivalentes. 

Otro ejemplo del efecto de la inversión lo constituye una familia 
de círculos tangentes entre sí en el punto de inversión. Efectuada la 


B 
A 
o 


Fia, 62.—Circunferencias tangentes transformadas en rectas paralelas. 
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transformación se tendrá un haz de rectas paralelas, pues las imágenes 
de las circunferencias son rectas y ningún par de éstas se corta, ya que 
las circunferencias originales no tienen otro punto común que el O, 

2. Aplicación al problema de Apolonio.—Una buena ilustración 
de la utilidad de la inversión es la siguiente solución geométrica in- 
mediata del problema de Apolonio. Mediante una inversión respecto a 
un punto cualquiera, el problema de Apolonio para tres círculos dados 
puede transformarse en el problema de Apolonio correspondiente a 
otros tres círculos (¿por qué?). Luego, si podemos resolver el proble- 
ma para una terna cualquiera de circunferencias, quedará resuelto 
para otra terna cualquiera, obtenida de la primera por inversión. Sa- 





Fica. 63.— Construcción preliminar de Apolonio. 


caremos ventaja de este hecho eligiendo entre todas estas ternas de 
círculos equivalentes una determinada, para la cual el problema re- 
sulta casi trivial. 

Partimos de tres circunferencias de centros A, B, C, y supondre- 
mos que la circunferencia buscada U, de centro O y radio p, es tan- 
gente exteriormente a los tres círculos dados. Si aumentamos los ra- 
dios de los tres círculos dados en una misma cantidad d, entonces la 
circunferencia de igual centro O y radio p — d resolverá, evidente- 
mente, el nuevo problema. Como fase inicial haremos uso de este 
hecho para reemplazar. las tres circunferencias dadas por otras tres, 
tales que dos de ellas sean tangentes entre sí en un punto K (Fig. 63). 
A continuación, invertiremos la figura entera respecto de un círculo 
de centro K. Las circunferencias de centros B y C se transformarán 
en rectas paralelas b y c, mientras la tercera se transformará en otra 
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circunferencia a (Fig. 64). Sabemos que a, b y c pueden ser construí- 
dos con regla y compás. La circunferencia desconocida U se transfor- 
mará en una circunferencia u tangente a a, b y c, y su radio, r, es evi- 





Fic. 64.—Solución del problema de Apolonio, 


dentemente la mitad de la distancia entre b y c. Su centro O” es una 
de las dos intersecciones de la paralela media entre b y c con la cir- 
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Fra. 65.—Simetria reiterada sobre los cuatro lados 
de un cuadrado. 


cunferencia de centro 
A” (centro de a) y ra- 
dio r + s (s es el radio 
de a). Finalmente, por 
construcción de la cir- 
cunferencia inversa de 
u, determinaremos el 
centro del círculo de 
Apolonio buscado, U. 
(Su centro O será el 
inverso, en la cirecunfe- 
rencia de inversión, del 
punto inverso de K 
en u.) 

*3. Simetrías reite- 
radas.—Para todos son 
familiares los extraños 
fenómenos de reflexión 
que se producen cuando 


se dispone de más de un espejo. Si las cuatro paredes de una habitación 
rectangular estuviéran cubiértas con cuatro espejos ideales no absor- 
bentes, un punto luminoso tendría infinitas imágenes, cada una corres- 
pondiente a cada habitación congruente obtenida por reflexión (figu- 
ra 65). Un conjunto de espejos menos regular (p. ej., tres espejos) dará 
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una serie mucho más complicada de imágenes. La configuración resul- 
tante puede ser descrita fácilmente sólo si los triángulos reflejados 
forman un cubrimiento sin solapamiento del plano. Esto sucede sólo 






t 
sk ¡Xx t 7 voy si 
1 NS * ] v Ne INS i 
E DN SN ] i 
| od E i 1 x t y ; 
| ES l ? / E / to ty 
K- Ea 1 Y gae 
PALEN i IN AÑ 7) EN gy i i 
t , 
4 Š ENS N / AS / ' HAN LEA e 
l Sxl% ' y Y vo o/ | W 
1 * A t y , tow o, 
=> *x/ NX ł š INT TIV z yy r7 
l SINEN ' g N í i 
l 


Fıc. 68.—Constelaciones regulares de espejos triangulares. 


en los casos del triángulo isósceles rectángulo, el triángulo equilátero 
y la mitad rectangular de éste. (Véase Fig. 66.) 

La situación se hace mucho más interesante si consideramos in- 
versiones repetidas respecto a un par de circunferencias. Colocándonos 
entre dos espejos circulares concéntricos se pueden ver otros infinitos 


Fıc. 67.—Reflexión reiterada en sistemas de dos círculos, 


176 VARIOS MÉTODOS PARA OBTENER CONSTRUCCIONES — [cAP. 3 
A A AO 





Fla, 68.—Reflexión en un sistema de tres círculos, 


círculos concéntricos. Una sucesión de estos círculos tiende a infinito, 
mientras la otra se concentra alrededor del centro. 

El caso de dos circunferencias exteriores es algo más complicado. 
Aquí los círculos y sus imágenes se reflejan sucesivamente uno en 
otro disminuyendo en cada reflexión, hasta reducirse a dos puntos, 
uno en cada círculo. (Estos puntos tienen la propiedad de ser inver- 
sos respecto a ambos círculos; véase figura 67.) Con tres círculos se 
forma el bello dibujo de la figura 68. 


CAPÍTULO IV 


GEOMETRÍA PROYECTIVA. AXIOMÁTICA. 
GEOMETRÍAS NO EUCLÍDEAS 


I. INTRODUCCIÓN 


1. Clasificación de las propiedades geométricas. Invariancia respec- 
to a las transformaciones.—La geometría se ocupa de las propiedades 
de las figuras del plano o del espacio. Estas propiedades son tan nu- 
merosas y variadas, que es necesario algún principio de clasificación 
para poner orden en esta riqueza de conocimientos. Se puede, p. ej., 
introducir una clasificación basada en el método utilizado para dedu- 
cir los teoremas. Desde este punto de vista, se hace usualmente una 
distinción entre procedimientos «sintéticos» y «analíticos». El primero 
de éstos es el método axiomático clásico de Euclides, en el cual el 
edificio se construye sobre fundamentos puramente geométricos, inde- 
pendientes del álgebra y del concepto de continuo numérico, y los 
teoremas se deducen por razonamiento lógico de un conjunto inicial 
de proposiciones llamadas axiomas o postulados. El segundo método 
se basa en la introducción de coordenadas numéricas, y utiliza la 
técnica del álgebra. Este método ha originado un cambio profundo : 
en la ciencia matemática, del que ha resultado la unificación de la 
geometría, el análisis y el álgebra en un sistema orgánico. 

En este capítulo, la clasificación según el método será menos im- 
portante que la hecha de acuerdo con el contenido, basada en el carác- 
ter de los propios teoremas, e independiente de los métodos usados 
para demostrarlos. En geometría plana elemental se distingue entre 
teoremas que tratan de la congruencia de figuras y utilizan los concep- 
tos de longitud y ángulo, y teoremas que se refieren a la semejanza 
de figuras, y que sólo utilizan el concepto de ángulo. Esta distinción 
particular no es muy importante, ya que longitud y ángulo están rela- 
cionados tan íntimamente que más bien resulta artificial separarlos. 
(Es el estudio de esta relación lo que constituye la mayor parte del 
contenido de la trigonometria.) En lugar de ello, podemos decir que 
los teoremas de la geometría elemental se ocupan de magnitudes: lon- 
gitudes, medidas de ángulos, y áreas. Dos figuras son equivalentes, 
desde este punto de vista, si son congruentes, es decir, si una puede 
obtenerse de la otra mediante un movimiento rigido, en el cual sólo 
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cambia la posición, pero no la magnitud. Surge ahora la cuestión de 
si el concepto de magnitud y los de congruencia y semejanza, rela- 
cionados con él, son esenciales en geometría, o si las figuras geométri- 
cas pueden tener aún otras propiedades más profundas, que subsistan 
después de transformaciones más drásticas que los movimientos rígi- 
dos. Vamos a ver que así acontece. 

Supongamos que se dibuja una circunferencia y un par de diá- 
metros perpendiculares en un trozo rectangular de madera blanda, 
como indica la figura 69. Si colocamos el trozo entre las mordazas de 
un potente tornillo de banco y lo comprimimos hasta que tenga la 
mitad de su ancho original, el círculo se habrá transformado en una 


FıG. 69.—Compresión de un circulo. 


elipse y el ángulo entre los diámetros de la elipse ya no será recto. 
La circunferencia tiene la propiedad de que sus puntos equidistan del 
centro, mientras que esto no es verdad para la elipse. Pudiera parecer 
que todas las propiedades geométricas de la figura original han sido 
destruídas por la compresión. Pero ni mucho menos es así; p. ej., la 
propiedad de que el centro divide a cada diámetro en dos partes igua- 
les es válida, tanto para la circunferencia como para la elipse. He aquí 
una propiedad que subsiste después del cambio drástico en las magni- 
tudes de la figura original. Esta observación sugiere la posibilidad de 
clasificar los teoremas sobre las figuras geométricas según que sigan 
verificándose o dejen de ser ciertos cuando la figura se somete a una 
compresión uniforme. Más en general: dado un tipo definido de trans- 
formaciones de una figura (como la clase de los movimientos rígidos, 
compresiones, inversiones respecto a circunferencias, etc.) podemos 
investigar qué propiedades de la figura permanecen invariables cuan- 
do se somete a esta clase de transformaciones. El conjunto de teore- 
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mas referentes a estas propiedades será la geometria asociada a dicha 
clase de transformaciones. La idea de clasificar las diferentes ramas de la 
geometría de acuerdo con los tipos de transformaciones consideradas 
fué propuesta por Félix Klein (1849-1925) en su famosa comunicación 
(el «Programa de Erlangen») presentada en 1872. Desde entonces ha 
dominado enormemente el pensamiento matemático. 

En el capítulo V nos encontraremos con el hecho verdaderamente 
sorprendente de que ciertas propiedades geométricas son tan íntima- 
mente intrínsecas, que persisten después que las figuras han sido so- 
metidas a deformaciones muy arbitrarias; figuras dibujadas en una 
lámina de caucho que se estira o comprime de cualquier manera, to- 
davía conservan algunas de sus características originales. En este ca- 
pitulo, sin embargo, vamos a ocuparnos solamente de aquellas pro- 
piedades que permanecen invariables o «invariantes» bajo un tipo espe- 
cial de transformaciones, situado entre la clase muy restringida de 
los movimientos rígidos, por un lado, y la clase más general de las 
deformaciones arbitrarias, por otro. Ésta es la clase de las «transfor- 
maciones proyectivas». 

2. Transformaciones proyectivas.—Los matemáticos se vieron im- 
pulsados desde hace mucho tiempo al estudio de estas propiedades 
geométricas, debido a los problemas de perspectiva, que fueron estu- 
diados por artistas como Leonardo de Vinci y Alberto Durero. La 
imagen trazada por un pintor puede considerarse como la proyección 
del original sobre la tela, con el centro de proyección en el ojo del pin- 
tor. En este proceso, las longitudes y los ángulos se alteran necesaria- 
mente en forma que depende de las posiciones relativas de los diversos 
objetos pintados. Sin embargo, puede reconocerse sobre la tela, gene- 
ralmente, la estructura geométrica del original. ¿Cómo es esto posi- 
ble? Lo es, porque existen propiedades geométricas «invariantes en la 
proyección», propiedades que aparecen sin alterar en la imagen y que 
hacen posible la identificación. Deducir y analizar estas propiedades 
constituye el objeto de la geometría proyectiva. 

Es obvio que los teoremas de esta rama de la geometría no pueden 
ser proposiciones sobre longitudes y ángulos o sobre congruencia. Algu- 
nos hechos aislados, de naturaleza proyectiva, son bien conocidos desde 
el siglo xvii, y aun, como en el caso del «teorema de Menelao», desde 
la antigüedad clásica. Pero el estudio sistemático de la geometría pro- 
yectiva no comenzó hasta fines del siglo xv11, cuando l'École Poly- 
technique de París inició una nueva etapa de progreso matemático, 
particularmente en geometría. Esta Escuela, surgida de la Revolución 
francesa, produjo muchos oficiales para los servicios militares de la 
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República. Uno de sus graduados fué J. V. Poncelet (1788-1867); que 
escribió su famoso Traité des propriétés projectives des figures en 1813, 
mientras era prisionero de guerra en Rusia. En el siglo x1x, bajo la 
influencia de Steiner, von Staudt, Chasles y otros, la geometría pro- 
yectiva se convirtió en uno de los principales temas de investigación 
matemática. Su popularidad fué debida en parte a su gran encanto 
estético y en parte también a su efecto aclaratorio sobre la geometría 
en conjunto, y a su íntima conexión con la geometría no euclidea y 
el álgebra. 


1. CONCEPTOS FUNDAMENTALES 


1. Grupo de las transformaciones proyectivas.—Definiremos pri- 
mero la clase o grupo 1 de las transformaciones proyectivas. Suponga- 
mos dos planos x y x’ en el espacio, no necesariamente paralelos, y 


10) 





Fic. 70,—Proyección desde un punto. 


hagamos una proyección central de n sobre z’ desde un centro dado O 
no situado sobre x ni sobre rr”, definiendo la imagen de cada punto P 
de x como aquel punto P’ de x’ tal que P y P' están sobre la misma 


1 La palabra grupo, cuando se aplica a una clase de transformaciones, implica que la 
aplicación sucesiva de dos transformaciones de la clase equivale a una transformación de 
la misma clase, y que la inversa de una transformación de la clase pertenece también a 
ella. Las propiedades de grupo de las operaciones matemáticas han desempeñado y segui- 
rán desempeñando un gran papel cn muchos campos, aunque en geometría, quizá, la 
importancia del concepto de grupo ha sido algo exagerada. 


SEC. 11] CONCEPTOS FUNDAMENTALES 181 





recta que pasa por O. Podemos también efectuar una proyección para- 
lela si hacemos que todos los rayos proyectantes sean paralelos, Del 
mismo modo se puede definir la proyección de una recta 1 de un pla- 
no xz sobre otra recta l’ de x’ desde un punto O de x, o hacerlo me- 
diante proyección paralela, 

Una representación de una figura sobre otra mediante una proyec- 
ción central o paralela, o por una sucesión finita de tales proyecciones, 
se llama transformación proyectival. La geometría proyectiva del plano 





Fra. 71.—Proyección paralela. 


o de la recta consiste en el conjunto de aquellas proposiciones geomé- 
tricas que permanecen invariables en una transformación proyectiva 
arbitraria de las figuras a las que se refieren. Por el contrario, llama- 
remos geometría métrica al conjunto de aquellas proposiciones que tra- 
tan de las magnitudes de las figuras, invariantes sólo respecto a la 
clase de los movimientos rígidos. 

Algunas propiedades proyectivas pueden reconocerse inmediata- 
mente. Un punto, por supuesto, se proyectará en un punto. Además, 
una recta se proyectará en una recta; pues si la recta l de x se proyecta 
sobre el plano z’, la intersección de x’ con el plano determinado por O 
y l será una recta ?, Si un punto A y una recta l son incidentes 3, el 


1 Dos figuras relacionadas por una sola proyección se dicen comúnmente perspectivas. 
Así, pues, una figura F está ligada mediante una translormación proyectiva a otra F” si 
F y F son perspectivas, o si podemos hallar una sucesión de figuras F, Fi, Fs, Fa, ... Fo, 
F", tales que cada una sea perspectiva con la siguiente. 

2 Hay excepciones si la recta OP es paralela al plano rx (o si lo es el plano de O y DD. 
Estas excepciones serán tratadas en 1V. 

3 Un punto y una recta se dicen incidentes si Ja recta pasa por el punto o si el punto 
está en la recta, 
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punto correspondiente A” y la recta l’ lo son también en la proyección. 
Luego la incidencia de punto y recta es invariante respecto al grupo 
proyectivo. De este hecho surgen muchas consecuencias simples, pero 
importantes. Si tres o más puntos son colineales, es decir, pertenecen 
a una misma recta, entonces sus imágenes son también colineales. 
Asimismo, si en el plano ~ tres o más rectas son concurrentes, es decir, 
inciden en un mismo punto, entonces sus imágenes serán también rec- 
tas concurrentes. Mientras estas propiedades simples, incidencia, coli- 
. nealidad y concurrencia son propiedades proyectivas (es decir, propie- 





Q P 


Fic. 72.—Configuración de Desargues en el plano, 


dades invariantes en las proyecciones), en cambio, las medidas de lon- 
gitudes y ángulos, y las razones de tales magnitudes, se alteran en 
general en la proyección. Los triángulos equiláteros e isósceles pueden 
proyectarse en triángulos cuyos lados tengan longitudes diferentes. 
Por tanto, aunque «triángulo» es un concepto de geometría proyectiva, 
«triángulo equilátero» no lo es, y pertenece sólo a la geometria métrica. 

2. Teorema de Desargues.—Uno de los primeros descubrimientos 
de la geometría proyectiva fué el famoso teorema sobre triángulos de 
Desargues (1593-1662). Si, en un plano, dos triángulos ABC y A'B'C' 
son tales que las rectas que unen: vértices correspondientes concurren en 
un punto O, los lados correspondientes se cortan en tres puntos colineales. 
La figura 72 ilustra el teorema y el lector puede dibujar otras figuras 
para comprobarlo experimentalmente. La demostración no es trivial, 
no obstante la sencillez de la figura, constituída sólo por rectas. El 
teorema pertenece sin duda a la geometría proyectiva, pues si pro- 
yectamos la figura entera sobre otro plano, conservará todas las pro- 
piedades enunciadas en el teorema. Daremos una demostración de 
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este teorema en V. Por el momento, observemos el hecho notable de 
que el teorema de Desargues es también cierto si los triángulos están 
en diferentes planos (no paralelos), y que este teorema de Desargues 
de la geometría tridimensional es muy fácil de probar. 

Supongamos que las rectas AA”, BB’ y CC' se cortan en O (figu- 
ra 73), de acuerdo con la hipótesis. Entonces AB está en el mismo 
plano de A'B’, de modo que estas dos rectas se cortan en un punto Q; 
análogamente AC y A'C' se cortan en R, y BC y B'C' se cortan en P. 
Como P, Q y R están en las prolongaciones de los lados de ABC y 
A'B'C', deben estar en el mismo plano de cada uno de los dos trián- 
gulos, y, en consecuencia, están sobre la recta de intersección de estos 


O 














Fre. 73.—-Configuración de Desargues en el espacio. 


dos planos. Por tanto, P, Q y R son colineales, como queriamos probar. 

Esta sencilla demostración sugiere que podemos probar el teorema 
para dos dimensiones mediante, por decirlo asi, un paso al límite, 
aplastando la figura total de manera que los dos planos coincidan en 
el límite y el punto O, junto con los otros, caiga sobre este plano. Sin 
embargo, hay cierta dificultad en llevar a cabo tal proceso de límite, 
pues la recta de intersección PQR no está univocamente determinada 
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cuando los planos coinciden. No obstante, la figura 72 puede conside- 
rarse como una perspectiva de la figura del espacio representada en 
la 73, y este hecho puede utilizarse para demostrar el teorema en el 
caso plano, 


En efecto, existe una diferencia fundamental entre el teorema de Desargues 
en el plano y en el espacio. Nuestra demostración en tres dimensiones utiliza razo- 
namientos geométricos basados solamente en los conceptos de incidencia e inter- 
sección de puntos, rectas y planos. Puede probarse que la demostración del teo- 
rema bidimensional, si se procede por completo en el plano, requiere necesariamente 
el uso del concepto de semejanza de figuras, que es equivalente al concepto. mé- 
trico de longitud y no es ya una noción proyectiva. 

El teorema recíproco del de Desargues establece que si ABC y A*B“C' son dos 
triángulos situados de modo que los puntos de intersección de los pares de lados 
correspondientes sean colineales, las rectas que unen vértices correspondientes 
son concurrentes. Su demostración para el caso en que los triángulos estén en dos 
planos no paralelos, se deja como ejercicio al lector. 


NI. RAZÓN DOBLE 


1. Definición y prueba de su invariancia.—Así como la longitud 

de un segmento rectilíneo es la clave de la geometría métrica, hay tam- 
bién un concepto fun- 
damental de la geome- 
tría proyectiva, median- 
“te el cual pueden expre- 
sarse todas las propie- 
dades netamente pro- 
yectivas de las figuras. 
Si tres puntos A, B, 

C están sobre una recta, 
la proyección cambia, 
en general, no sólo las 
distancias AB y BC, 
sino también la razón 
TE ABJ]BC. En efecto, tres 

puntos cualesquiera A, 

B, C de una recta l pueden ser siempre coordinados con otros tres 
puntos arbitrarios A”, B', C' de otra recta l’ por medio de dos proyec- 
ciones sucesivas. Para esto, hagamos girar la recta l’ alrededor del 
punto C’, hasta que tome la posición 1” paralela a l (véase Fig. 74). 
A continuación, proyectamos l sobre 1'”, mediante una proyección pa- 
ralela a la recta que une C con C’, definiendo tres puntos A”, B” 
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y C” (C” = C’). Las rectas A'A” y B'B” deben cortarse en un pun- 
to O que elegimos como centro de la segunda proyección. Estas dos 
proyecciones nos dan el resultado deseado 1. 

Según acabamos de ver, ninguna magnitud relativa sólo a tres pun- 
tos de una recta queda invariante en una proyección. Pero —y esto 
constituye el descubrimiento decisivo de la geometría proyectiva— si 
tenemos cuatro puntos A, B, C, D de una recta, y los proyectamos 
sobre otra recta en A”, B’, C', D', existe entonces una cierta magnitud, 
llamada razón doble de los cuatro puntos, que conserva su valor en la 
proyección. He aquí una propiedad matemática de un conjunto de 
cuatro puntos de una recta que no desaparece mediante proyección y 
que puede reconocerse en cualquier imagen de la recta. La razón doble 
no es ni una longitud ni un cociente de dos longitudes, sino la razón 
de dos cocientes; si consideramos los cocientes CA/CB y DA/DB, por 
definición, la razón doble de los cuatro puntos A, B, C, D, tomados 
en este orden, es: 


Vamos a demostrar que la razón doble de cuatro puntos es invariante 
en la proyección; es decir, que si A, B, C, D y A’, B', C', D' son puntos 
correspondientes de dos rectas relacionadas por proyección, se verifica 


CA DA C'A’ D'A’ 


La demostración se logra con medios elementales. Recordemos que 
el área de un triángulo es igual a 1/a (base x altura) y está también 
dada por la mitad del producto de dos cualesquiera de sus lados por 
el seno del ángulo comprendido. Tenemos, en la figura 75: 

área OCTA = Yah - CA = 1/304 - OC sen COA 
área OCB = ah - CB = 1/40B > OC sen COB 
área ODA =1/sh + DA = 1/04 - OD sen DOA 
área ODB=!/sh - DB =1/10B - OD sen DOB, 


1 ¿Qué sucede si las rectas AA” y B'B” son paralelas? 
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de donde se deduce: 


CA DA CA DB OA: 0C + 


sen COA OB: OD- sen DOB 


CB'’DB CB DA 


~ ~ 
OB ; OC ; sen COB OA: OD - sen DOA 


PT eo 
sen COA sen DOB 


PAP a 
sen COB sen DOA 





Fic. 75. —Conservación de la razón doble en la proyección central. 


Luego la razón doble de A, B, C, D depende únicamente de los 
ángulos subtendidos desde O por los segmentos que unen A, B, C, D. 





C 


D 


Fic. 76.-—Conservación de la razon doble 
en la proyección paralela 


Como estos ángulos son los mis- 


mos para otros cuatro puntos 


cualesquiera A”, B', C', D' en 
los que A, B, C, D puedan ser 
proyectados desde O, resulta 
que la razón doble permanece 
invariable en la proyección. 


Que la razón doble de cuatro pun- 
tos no varía en una próyección pa- 
ralela se obtiene de propiedades ele- 
mentales de los triángulos semejantes, 
y la demostración se deja como ejer- 
cicio al lector. 


Hasta aquí, hemos entendi- 
do que la razón doble de cuatro 


puntos A, B, C, D de una recta 1 sólo incluye longitudes positivas. 
Resulta conveniente modificar esta definición como sigue: elegimos 
un sentido sobre l como positivo, y convenimos en que las longitudes 
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medidas en este sentido serán positivas, mientras que las medidas en 
sentido opuesto serán negativas. Definiremos entonces la razón doble 
de A, B, C, D, considerados en este orden, por 


asen = A 24 
( )= CE DB’ 


(1) 
donde los números CA, CB, DA, DB han de ser tomados con su pro- 
pio signo. Como la inversión del sentido positivo de 1 sólo cambia el 
signo de cada término de este cociente, el valor de (A BCD) no depen- 
derá del sentido elegido como posi- 

tivo. Es fácil ver que (A BCD} será (ABCD)>0 

negativa o positiva según que el A B C D 

par de puntos A, B esté o no se- “9 AO 
parado (es decir, entrelazado) por 

el par C, D. Como esta propiedad (ABCD)<O 

de separación es invariante en la 

proyección, el signo de la razón A C B D 
doble (ABCD) es también inva- Fio. 77.—Signo de la razón doble. 
riante. Si elegimos un punto fijo O 

de l como origen, y tomamos como abscisa x de cada punto de l su 
distancia orientada a partir de O; es decir, si las abscisas de A, B, 
C, D son zı, Te, Tg, Ta, respectivamente, tenemos que 

CA DA _ 3-1 Ta—%1 T3—T1 T4— T2 


 _A _—_-_ _E-_>> __ -__—— e maa e aal 


ABCD) = ~x: -e = : 
( ) CB" DB X3— Ts T4— T3 Ta — Ts r4— Ya 


Si (ABCD) = —1, es decir, CA/CB = —DAĮJDB, C y D dividen 


entonces al segmento AB, interior y exteriormente, en la misma 
razón. En este caso se dice que C y D dividen al segmento AB armó- 


A BC D 





Fic, 78,—Razón doble expresada por medio de abscisas. 


nicamente, y cada uno de los puntos C y D se llama conjugado armónico 
del otro, respecto del par A, B. Si (ABCD) = 1, los puntos C y D 
(o A y B) coinciden. 

Se debe tener presente que el orden en que se toman A, B, C, D 
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es parte esencial de la definición de la razón doble (ACBD); p. ej., si 
(ABCD) = >, la razón doble (BACD) es 1/A, mientras que (ACBD)= 
= 1 — à, como el lector puede verificar fácilmente. Cuatro puntos 
A, B, C, D pueden ordenarse de 4 - 3 - 2 - 1 = 24 maneras distintas, 
cada una de las cuales da un cierto valor a la razón doble. Algunas de 
estas permutaciones dan, no obstante, el mismo valor que el orden ori- 
ginal A, B, C, D; por ejemplo, (A BCD) = (BADC). Dejamos como ejer- 
cicio al lector el demostrar que hay sólo seis valores diferentes de la ra- 
zón doble para las 24 permutaciones diferentes de los puntos, que son: 


E A a ee : à 
i to, A A’? 1A? Ai 











Estas seis cantidades son, en general, distintas, pero dos de ellas 
pueden coincidir, como en el caso de la división armónica, cuando 
A=-1. 

Podemos definir también la razón doble de cuatro rectas 1, 2, 3, 4 
coplanarias (es decir, situadas en un mismo plano) y concurrentes, como 
la razón doble de los cuatro puntos de intersección de estas rectas con 
otra del mismo plano. La posición de esta quinta recta es indiferente, 
debido a la invariancia de la razón doble en la proyección. Equiva- 
lente a ésta es la definición: 
sen (1,3) sen (1, 4) 

0234 = E) aan 

que debe tomarse.con signo más o menos según que un par de rectas 
separe o no al otro par. [En esta fórmula (1, 3), p. ej., representa el 
ángulo formado por las rectas 1 y 3.] Finalmente, podemos definir la 
razón doble de cuatro planos coaxiales (cuatro planos del espacio que se 
` cortan en una recta l, su eje). Si una recta corta a los planos en cua- 
tro puntos, estos puntos tendrán siempre la misma razón doble, cual- 
quiera que sea la posición de dicha recta. (La demostración de esta 
propiedad se deja al lector como ejercicio.) Podemos, pues, adoptar 
este valor como el de la razón doble de los cuatro planos. En forma 
equivalente, se puede definir la razón doble de cuatro planas coaxiales 
por medio de la de las cuatro rectas determinadas al cortarlos por un 
quinto plano (véase Fig. 79). 

El concepto de razón doble de cuatro planos nos lleva natural- 
mente a la pregunta de si puede definirse una transformación proyec- 
tiva del espacio tridimensional en sí mismo. No es posible generalizar 
de modo inmediato la definición mediante una proyección central, de 
dos a tres dimensiones; pero puede demostrarse que toda transfor- 
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mación continua de un plano en sí mismo que establezca una corres- 
pondencia biunívoca entre puntos y puntos, por una parte, y rectas 
y rectas, por otra, es una transformación proyectiva. Este teorema 
sugiere la siguiente definición para el caso de tres dimensiones. Una 


CA 


— 


Fic. 79.—Razón doble de planos coaxiales. 


transformación proyectiva del espacio es toda transformación biuní- 
voca y continua que conserva las rectas. Puede demostrarse que en 
estas transformaciones la razón doble permanece invariante. 

Las proposiciones precedentes se pueden completar mediante algu- 
nas observaciones. Supongamos dados tres puntos distintos A, B, C 
de una recta, con abscisas £1, £2, Ig; se desea encontrar un cuarto 
punto D, tal que (ABCD) = à, siendo A prefijado. (El caso especial 

= —1, para el cual el problema equivale a la construcción del cuarto 
armónico, será explicado con más detalle en la sección próxima.) En 
general, el problema tiene solución única, pues si es x la abscisa del 
punto pedido D, la ecuación 


Ta — Tı T — T3 





= [2] 
Ta — T3 TA 


tiene exactamente una solución z. Si se dan Tı, £a, 23, y simplificamos 
la ecuación [2] haciendo (13 — 1:1)/(13 — 12) = k, encontraremos, al 


COURANT.—8 
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resolver dicha ecuación, que x = (kx2 — M1)/(k — A); p. ej. si los 
tres puntos A, B, C son equidistantes, de abscisas 11 = 0, 12 = d, 
z3 = 2d, respectivamente, . entonces: k = (2d — 0)/(2d — d) = 2, y 
xz = 2d/(2 — 2). 

Si proyectamos la misma recta l sobre dos rectas distintas, l’ y l”, 
desde dos centros diferentes O’ y O”, obtenemos una correspondencia 


o” 





Fto. 80. —Correspondencia proyectiva entre los puntos de dos rectas. 


P <—> P” entre los puntos de l y l’, y otra P «— P” entre los de ? 
y l”. Esto establece una correspondencia P’ «—> P” entre los puntos 
de [' y los de l”, con la propiedad de que toda cuaterna de puntos 
A”, B',C', D', de l tiene la misma razón doble que la cuaterna corres- 
pondiente A”, B”, C”, D”, de l’. Toda correspondencia biunívoca 
entre los puntos de dos rectas que goce de esta propiedad se llamará 
correspondencia proyectiva, cualquiera que sea la forma en que haya 
sido definida. 


Ejercicios: 

1. Demuéstrese que, dadas dos rectas en correspondencia proyectiva, puede 
trasladarse una de ellas mediante un desplazamiento paralelo hasta una posición 
tal que la correspondencia dada se obtenga por simple proyección. (Sugerencia: 
háganse coincidir un par de puntos correspondientes de las dos rectas.) 

2. Basándose en el resultado precedente, pruébese que si los puntos de las 
rectas l y l’ se coordinan mediante una sucesión finita de proyecciones sobre varias 
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rectas intermedias, usando centros arbitrarios de proyección, el mismo resultado 
puede obtenerse mediante sólo dos proyecciones. 


2. Aplicación al cuadrilátero completo.—Como aplicación intere- 
sante de la invariancia de la razón doble, estableceremos un teorema 
sencillo, pero importante, de geometría proyectiva. Se refiere al cua- 
drilátero completo, figura que consta de cuatro rectas cualesquiera (no 
concurrentes tres a tres), y de los seis puntos en que se cortan. En la 
figura 81, las cuatro rectas son AE, BE, BI y AF. Las rectas AB, 
EG e IF son las diagonales del cuadrilátero. Elijamos una diagonal, 
p. ej., AB, y señalemos sobre ella los puntos C y D donde encuentra 
a las otras dos diagonales. El teorema dice entonces que (A BCD) =—1, 
o sea: los puntos de intersección de una diagonal con las otras dos sepa- 





——— > 
; D 


FtG. 81.—Cuadrilátero completo. 


ran armónicamente a los vértices del cuadrilátero situados sobre dicha 
diagonal. Para probarlo basta observar que 


x = (ABCD) = (IFHD) por proyección desde E. 
(IFHD}) = (BACD) por proyección desde G. 


Pero sabemos que (BACD) = 1/(4BCD), o sea, r=1/x, z = 1, 

x = +1, y como C, D separan a A y B, la razón doble x debe ser 

negativa; es decir, igual a —1, quedando demostrado el teorema. 
Esta notable propiedad del cuadrilátero completo nos permite 
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construir, sin más ayuda que la regla, el conjugado armónico, respecto 
a un par A, B, de un tercer punto colineal C. Necesitamos solamente 
elegir un punto E fuera de la recta; trazar EA, EB, EC; elegir un 
punto G sobre EC; trazar AG y BG, que cortan a EB y EA en Fel, 

respectivamente, y dibujar 

IF, la cual corta a la recta 
omamo —— — ABC en el punto D, cuarto 


A A armónico pedido. 
Fic. 82.—Prolongación de una recta al otro Problema,—Dado un segmen- 
lado de un obstáculo. to AB en el plano y una región 


R, como se muestra en la figu- 
ra 82, se desea prolongar la recta a la derecha de R. ¿Cómo puede lograrse esto 
con la regla sola, sin atravesar R en la construcción? (Sugerencia: Elíjanse dos 
puntos C, C’ del segmento AB, y hállense sus conjugados armónicos D, D', res- 
pectivamente, por medio de cuatro cuadriláteros que tengan A y B como vér- 
tices.) 


IV. PARALELISMO E INFINITO 


1. Puntos del infinito como «puntos ideales». —Algunos de los ar- 
gumentos utilizados en la sección precedente fallan si ciertas rectas de 
las utilizadas en las construcciones, supuestas prolongadas hasta su 
intersección, resultan paralelas; p. ej., en la construcción del cuarto 
armónico, D deja de existir si la recta ZF resulta paralela a AB. El 
razonamiento geométrico parece complicarse a cada paso por el hecho 
de que dos rectas paralelas no se cortan, ya que en toda discusión 
que incluya la intersección de rectas el caso excepcional de parale- 
lismo debe considerarse y formularse por separado. Asimismo, la pro- 
yección desde un centro O debe distinguirse de la proyección para- 
lela, la cual exige tratamiento aparte. Si realmente entrásemos en una 
detallada discusión de cada caso excepcional, la geometría proyectiva 
resultaría muy complicada. Nos vemos inducidos, por tanto, a ensa- 
yar un nuevo recurso, el de hallar generalizaciones de nuestros conceptos 
básicos, que eliminen las excepciones. 

Aquí la intuición geométrica nos indica el camino; si una recta 
que corta a otra gira lentamente hasta ser paralela, el punto de inter- 
sección de ambas se alejará hasta el infinito. Podemos simplemente 
decir que las dos rectas se cortan en un «punto del infinito». Lo esen- 
cial es, entonces, dar significado preciso a esta vaga afirmación, con 
el fin de poder operar con los puntos del infinito o, como a veces se 
dice, puntos ideales, del mismo modo que con los puntos ordinarios 
del plano o del espacio. En otras palabras, deseamos que todas las 
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reglas concernientes a las relaciones entre puntos, rectas y planos, etc., 
persistan aun cuando estos elementos geométricos sean ideales. Para 
alcanzar este propósito podemos proceder, bien intuitiva o formal- 
mente, tal como se hizo al extender el sistema numérico, donde un 
método consistía en la idea intuitiva de medida, y el otro partía de 
las reglas formales de las operaciones aritméticas. 

Antes de nada, observemos que en geometría sintética, incluso los 
conceptos básicos de punto y recta «ordinarios» no están definidos 
matemáticamente. Las llamadas definiciones de .estos entes que en- 
contramos con frecuencia en los textos de geometría elemental son 
sólo descripciones más o menos sugerentes. En el caso de los elementos 
geométricos ordinarios, nuestra intuición nos tranquiliza en lo que a 
su «existencia» se refiere. Pero lo que realmente necesitamos en geo- 
metría, considerada como un sistema matemático, es la validez de 
ciertas reglas mediante las cuales podamos operar con estos concep- 
tos, tales como unir puntos, hallar la intersección de rectas, etc. Lógi- 
camente considerado, un «punto» no es una «cosa en sí», sino que está 
caracterizado por la totalidad de las proposiciones mediante las cua- 
les se halla relacionado con otros objetos. La existencia matemática 
de «puntos del infinito» quedará asegurada en cuanto se establezcan, 
de forma clara y no contradictoria, las propiedades matemáticas de 
estos nuevos entes; es decir, sus relaciones con los puntos «ordinarios» 
y entre sí. Los axiomas ordinarios de la geometría (p. ej., el de Eucli- 
des) son abstracciones del mundo físico, de señales de lápiz o de tiza, 
cuerdas tensas, rayos de luz, varillas rígidas, etc. Las propiedades 
que estos axiomas atribuyen a los puntos y rectas matemáticos son 
descripciones muy simplificadas e idealizadas de la conducta de sus 
representantes físicos. Entre dos señales puntiformes marcadas con 
lápiz, pueden trazarse no una, sino varias rectas. Si los puntos se 
hacen cada vez más pequeños, entonces todas estas rectas tendrán 
aproximadamente la misma apariencia. Esto es lo que se piensa cuan- 
do se establece como axioma geométrico que «por dos puntos puede 
trazarse una recta y sólo una»; no nos referimos a los puntos y rectas 
físicos, sino a los puntos y rectas conceptuales y abstractos de la 
geometría. Los puntos y rectas geométricos tienen propiedades esen- 
cialmente más sencillas que las de los objetos físicos, y esta simplifi- 
cación procura la condición esencial para el desarrollo de la geometría 
como ciencia deductiva. 

Conforme hemos señalado, la geometría ordinaria de los puntos y 
rectas se complica grandemente por el hecho de que un par de rectas 
paralelas no tienen punto de intersección. Nos vemos, pues, obliga- 
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dos a introducir una posterior simplificación en la estructura de la 
geometría, ampliando el concepto de punto geométrico, para hacer 
desaparecer esta excepción. Y, análogamente a la forma en que he- 
mos ampliado el concepto de número para hacer posibles sin restricción 
la resta y la división, aquí también nos guiará el deseo de conservar, en 
el dominio ampliado, las leyes que gobiernan el dominio original. 

Convenimos, pues, en agregar a los puntos ordinarios de cada recta 
un solo punto «ideal». Este punto se considerará como perteneciente a 
lodas las rectas paralelas a la dada y únicamente a ellas. Como conse- 
cuencia de este convenio, todo par de rectas del plano se cortará en 
un solo punto; si las rectas no son paralelas, su intersección será un 
punto ordinario, mientras que si lo son, se cortarán en el punto ideal 
común a las dos rectas. Por razones intuitivas, el punto ideal de una 
recta se llama punto del infinito de la misma. 


El concepto intuitivo de punto en el infinito de una recta parece sugerir que 
debían agregarse dos puntos ideales a cada recta. La razón para que sea uno solo, 
tal como hemos hecho, es que deseamos conservar la ley de que por dos puntos 
puede trazarse una y sólo una recta. Si una recta tuviera dos puntos del infinito 
comunes con toda recta paralela, entonces por estos dos «puntos» pasarían infini- 
tas rectas paralelas. 


Convendremos también en agregar a las rectas ordinarias del plano 
una sola recta «ideal» (llamada también recta del infinito del plano), 
la cual contiene todos los puntos ideales del plano y ningún otro punto. 
Se nos impone precisamente este convenio si deseamos conservar la 
ley inicial de que entre dos puntos cualesquiera puede trazarse una 
recta y la nueva ley, según la cual dos rectas cualesquiera se cortan 
en un punto. Para ver esto, elijamos dos puntos ideales arbitrarios. 
La recta única determinada por estos dos puntos no puede ser una 
recta ordinaria, ya que por el convenio adoptado, toda recta ordinaria 
contiene un solo punto ideal. Además, esta recta no puede contener 
puntos ordinarios, puesto que un punto ordinario y uno ideal deter- 
minan una recta ordinaria. Finalmente, esta recta debe contener todos 
los puntos ideales, si deseamos que tenga un punto común con toda 
recta ordinaria. En consecuencia, esta recta debe tener precisamente 
las propiedades que hemos asignado a la recta ideal del plano. 

De acuerdo con nuestros convenios, un punto del infinito está 
determinado o representado por una familia de rectas paralelas, asi 
como un número irracional viene determinado por una sucesión de 
intervalos racionales. La afirmación de que la intersección de dos rec- 
tas paralelas es un punto del infinito carece de significado misterioso; 
es sólo una manera cómoda de afirmar que las rectas son paralelas. 
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Esta forma de expresar el paralelismo en un lenguaje originalmente 
reservado para objetos intuitivamente diferentes, tiene el único pro- 
pósito de evitar la enumeración de los casos excepcionales superfluos; 
éstos quedan ahora automáticamente incluídos en las mismas expre- 
siones verbales u otros símbolos utilizados para los casos «ordinarios». 

En resumen, nuestros convenios acerca de los puntos del infinito 
han sido elegidos de manera que las leyes que rigen la relación de 
incidencia entre puntos y rectas ordinarias sigan cumpliéndose en el 
dominio ampliado de puntos, mientras que la operación de hallar el 
punto de intersección de dos rectas, antes sólo posible si éstas no eran 
paralelas, puede ahora efectuarse sin ninguna restricción. Las consi- 
deraciones que llevan a esta simplificación formal en las propiedades 
de la relación de incidencia pueden parecer algo abstractas, pero que- 
dan ampliamente justificadas por el resultado, como el lector compro- 
bará en las páginas que siguen. 

2. Elementos ideales y proyección.—La introducción de los pun- 
tos y la recta del infinito en el plano nos permite tratar la proyección 





F1G. 83.—Proyección en elementos del infinito. 


de un plano sobre otro en forma mucho más satisfactoria. Considere- 
mos la proyección de un plano ~% sobre otro plano xr”, desde un cen- 
tro O (Fig. 83). Esta proyección establece una correspondencia entre 
los puntos y las rectas de v y de x’. A cada punto A de x corresponde 
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un solo punto A’ de rr”, con las siguientes excepciones: si el rayo pro- 
yectante que pasa por O es paralelo al plano x’, entonces corta al 
plano en un punto A, al que no corresponde ningún punto ordinario 
de x’. Estos puntos excepcionales de x están en una recta la la cual 
no corresponde ninguna recta ordinaria de x’. Pero estas excepciones 
se eliminan, si convenimos en que a A corresponde el punto del infi- 
nito de z’ en la dirección de la recta OA, y que a l corresponde la 
recta del infinito de x’. En igual forma, asignamos un punto del infi- 
nito de x a todo punto B’, de la recta m’ de x’, por la que pasan todos 
los rayos trazados por O paralelos al plano x. A m’ le corresponde la 
recta del infinito de m. De este modo, mediante la introducción de 
los puntos y la recta del infinito del plano, una proyección de un plano 
sobre otro establece una correspondencia entre los puntos y rectas de 
ambos planos, que es biunivoca sin excepción. (Esto hace desaparecer 
las excepciones mencionadas en la nota ? de la pág. 181.) Además, es 
fácil ver que, como consecuencia de nuestro convenio, un punto estará 
sobre una recta si, y sólo si, la proyección del punto está sobre la proyección 
de la recta. Por tanto, todas las proposiciones acerca de puntos coli- 
neales, rectas concurrentes, etc., que incluyan sólo puntos, rectas y la 
relación de incidencia, deben considerarse como invariantes respecto 
a la proyección en sentido amplio. Esto nos permite tratar de los 
puntos del infinito de un plano x operando con los puntos ordinarios 
correspondientes de un plano x’, relacionado con m mediante una 
proyección. 

*La interpretación de los puntos del infinito de un plano x, por 
medio de una proyección desde un punto exterior O sobre puntos 
ordinarios de otro plano x’, puede utilizarse para dar un «modelo» 
euclídeo concreto del plano ampliado. Para este fin, olvidémonos del 
plano x’ y fijemos nuestra atención sobre æ y las rectas que pasan 
por O. A cada punto ordinario de z corresponde una recta que pasa por 
O y no es paralela a z; a cada punto del infinito de z corresponde una 
recta que pasa por O y es paralela a r. Luego a la totalidad de los 
puntos ordinarios e ideales de x, corresponde la totalidad de las rec- 
tas que pasan por O, y esta correspondencia es biunívoca sin excepción. 
A los puntos de una recta de v corresponden las rectas de un plano que 
pasa por O. Un punto y una recta de x son incidentes, si, y sólo si, 
la recta y plano correspondientes que pasan por O lo son. Por tanto, 
la geometría de la incidencia de puntos y rectas del plano ampliado 
es por entero equivalente a la geometría de la incidencia de rectas y 
planos ordinarios que pasan por un punto fijo del espacio. 

*En tres dimensiones la situación es similar, aunque ya no pode- 
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mos concretarla intuitivamente por proyección. De nuevo introduci- 
mos un punto del infinito asociado con cada familia de rectas paralelas. 
En cada plano tendremos una recta del infinito. A continuación de- 
beremos introducir un nuevo elemento, el plano del infinito, formado 
por todos los puntos del infinito del espacio y que contiene todas las 
rectas del infinito. Cada plano ordinario corta al plano del infinito 
en su recta del infinito. 

3. Razón doble con elementos en el infinito.—Debe hacerse una 
aclaración acerca de la razón 
doble cuando incluye ele- 
mentos del infinito. Designe- 
mos el punto del infinito 
de una recta l por el sím- 
bolo oo. Si A, B, C son tres 
puntos ordinarios de l, en- 
tonces podemos asignar un FıG. 84.—Razón doble con un punto 
valor al símbolo (A BCoo) de en-el infinito. 
la siguiente manera: elegido 
un punto P de l, (4 BCoo) será el límite a que tiende (A BCP) cuando 
P se aleja infinitamente sobre l; pero 





CA PA 
(ABCP) = Es PR’ 
y cuando P se aleja al infinito, PA/PB tiende a 1; en consecuencia, 
definimos (ABCoo) = CA/CB. 
En particular, si (ABCoo) = —1, C es el punto medio del seg- 
mento AB. El punto medio de un segmento y el punto del infinito de 
la recta soporte dividen armónicamente al segmento. 


Ejercicios: ¿Cuál es la razón doble de las cuatro rectas 1,, la, l3, la, si son pa- 
ralelas? ¿Cuál es la razón doble, si l4 es la recta del infinito? 


V. APLICACIONES 


1. Notas preliminares.—Con la introducción de los elementos del 
infinito ya no es necesario enunciar explícitamente los casos excep- 
cionales que surgen en las construcciones y teoremas, cuando dos o 
más rectas son paralelas. Sólo necesitamos recordar que si un punto 
está en el infinito, todas las rectas que pasan por él son paralelas. La 
distinción entre proyección central y paralela resulta innecesaria, pues 
la última significa simplemente proyección desde un punto del infi- 
nito. En la figura 72 el punto O o la recta PQR pueden ser del infinito 
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(la Fig. 85 muestra el primer caso). Se deja como ejercicio al lector el 
formular en lenguaje «finito» el correspondiente enunciado del teorema 
de Desargues. 

No sólo el enunciado, sino también la demostración de un teorema 
proyectivo resulta con frecuencia más sencilla mediante el uso de 
elementos del infinito. El principio general es el siguiente: por «clase 
proyectiva» de una figura geométrica F entendemos el conjunto de 
todas las figuras que pueden resultar de F por medio de transfor- 
maciones proyectivas. Las propiedades proyectivas de F serán idén- 
ticas a las de cualquier miembro de su clase proyectiva, ya que las 





Fr6, 85,—Configuración de Desargues con el centro en el infinito. 


propiedades proyectivas son, por definición, invariantes en la pro- 
yécción. Así, todo teorema proyectivo (es decir, referente sólo a propie- 
dades proyectivas) que se verifique para F será cierto también para 
todo miembro de la clase proyectiva de F, y recíprocamente. Por 
tanto, para demostrar uno de tales teoremas para F, bastará hacerlo 
para otro miembro ` cualquiera de su clase proyectiva. Es posible 
a veces sacar ventaja de esto hallando un miembro especial de la 
clase proyectiva de F para el cual el teorema sea más fácil de demos- 
trar que en el caso de la propia figura F; p. ej., dos puntos cualesquiera 
A, B de un plano v pueden transformarse en puntos del infinito, pro- 
yectándolos desde un centro O sobre un plano xz’ paralelo al plano de 
OAB; las rectas que pasan por A, y aquellas que pasan por B, se 
transformarán en dos familias de rectas paralelas. En los teoremas 
proyectivos que vamos a demostrar en esta sección haremos uso de 
esta transformación preliminar. 
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La siguiente propiedad elemental referente a rectas paralelas nos 
será muy útil en lo que sigue: sean dos rectas que pasan por un 





FIG, 86. 


punto O, y cortan a un par de rectas lı y la en los puntos A, B, C, D, 
tal como se ve en la figura 86. Si lı y l2 son paralelas, 


oA _ o8 
oc OD 
i OA OB 
y, recíprocamente, si DC = DD ’ l y la son paralelas. La demos- 


tración es consecuencia inmediata de propiedades elementales de la 
semejanza de triángulos y la dejamos como ejercicio al lector. 

2. Demostración del teorema de Desargues en el plano.—Vamos a 
dar ahora la demostración de que los triángulos ABC y A'B'C' de 
un plano, situados como en la figura 72, en los que las rectas determi- 





Fic, 87, —Demostración del teorema de Desargues. 


nadas por vértices correspondientes concurren en un mismo punto, 
tienen las intersecciones P, Q y R de los lados correspondientes en 
línea recta. Para ello, proyectemos primero la figura de modo que Q 
y R pasen a ser puntos del infinito. Después de la proyección, AB 
será paralela a A'B’ y AC lo será a AC”, con lo cual la figura aparecerá 
según se ve en la figura 87. Como ya antes hemos indicado, para 
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demostrar el teorema de Desargues en general, basta hacerlo sobre este 
tipo especial de figura. Para nuestro objeto necesitamos sólo probar 
que la intersección de BC y B'C' es también un punto del infinito; 
es decir, que BC es paralela a B'C'; entonces, P, Q y R serán coli- 
neales (ya que estarán en la recta del infinito). Ahora bien: 

AB || A'B’ implica 


s|s 
ajx 


AC || A'C' implica -— = — 
y s 

Por consiguiente, ujv = x/y, lo que supone BC |¡ B'C”, como que- 
ríamos probar. 

Observemos que en esta demostración del teorema de Desargues 
hacemos uso de la noción de longitud de un segmento; es decir, que 
hemos demostrado un teorema proyectivo con medios métricos. Ade- 
más, si las transformaciones proyectivas se definen «intrínsecamente» 
como transformaciones planas que conservan la razón doble (véase 
pág. 189), entonces la demostración se efectúa por completo en el plano, 


Ejercicio: Demuéstrese, en forma análoga, el recíproco del teorema de Desar- 
gues: si los triángulos ABC y A“B'C' tienen la propiedad de que P, Q y R son 
colineales, las rectas AA”, BB’ y CC’ son concurrentes. 

3. Teorema de Pascal *.—Este teorema dice: si los vértices de un 
hexágono están alternativamente sobre un par de rectas concurrentes, las 
tres intersecciones P, Q y R de los lados opuestos son colineales (Fig. 88). 
(El hexágono puede cortarse a sí mismo.) Los lados «opuestos» se iden- 
tifican en el diagrama esquemático de la figura 89. 

Mediante una proyección preliminar, supondremos que P y Q son 
puntos del infinito. Necesitamos probar, pues, que también R está 
en el infinito. La disposición está aclarada en la figura 90, en la que 











23 156 y 12 || 45. Para probar que 16 || 34, tenemos 
a b+y b a+r 
a+z b+y+s’ by atr+r 
Por consiguiente, 
a at+tzr+r 
b b+y+s’ 


es decir, 16 || 34, como queríamos demostrar. 


1 Más adelante (pág. 221) discutiremos un teorema más general del mismo tipo. El 
presente caso especial se conoce también por el nombre de su descubridor, Pappus de 
Alejandría (siglo 111 a. de J. C.). 
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Via. 38.-—Configuración de Pascal. Fie, 89. 





ò 1 Yy 5 s 3 


Fic. 90.—Demostración del teorema de Pascal. 
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4. Teorema de Brianchon.—Este teorema dice: si los lados de un 


hexágono pasan alternativamente por dos puntos fijos P y Q, las tres 
diagonales que unen pares de vértices opuestos del hexágono son concu- 


Qq 





Via. 91.—Configuración de Brianchon. 


rrentes (véase Fig. 91). Mediante una proyección podemos llevar al 
infinito el punto P y el punto en que se cortan dos diagonales, p. ej., 
14 y 36 (véase Fig. 92). Como 14 || 36, se tiene a/b = ujv. Pero x/y = a/b 
y ufo = r/s; por consiguiente, x/y = r/s y 36 1125; es decir, las tres 





Fic. 92.——Demostración del teorema de Brianchon. 
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diagonales son paralelas y, por tanto, concurrentes. Esto basta para 
probar el teorema en el caso general. 

5. Nota sobre la ley de dualidad.—El lector habrá observado la 
notable analogía entre los teoremas de Pascal (1623-1662) y de Brian- 
chon (1785-1864). Esta Semejanza resulta particularmente sorpren- 
dente si escribimos los teoremas uno al lado del otro. 


TEOREMA DE PASCAL TEOREMA DE BRIANCHON 


Si los vértices de un hexágono Si los lados de un hexágono 
están alternativamente sobre dos | pasan alternativamente por dos 
rectas, los puntos en que se cortan | puntos, las rectas que unen vérti- 
los lados opuestos son colineales. | ces opuestos son concurrentes. 


No sólo los teoremas de Pascal y Brianchon, sino todos los teore- 
mas de geometría proyectiva se presentan a pares, análogos uno a 
otro y, por decirlo así, idénticos en estructura. Esta relación se llama 
dualidad. En geometría plana el punto y la recta se denominan ele- 
mentos duales. Trazar una recta que pase por un punto, o señalar un 
punto sobre una recta, son operaciones duales. Dos figuras son duales 
si una puede deducirse de la otra reemplazando cada elemento y ope- 
ración por el elemento y operación duales; p. ej., los tevremas de Pas- 
cal y Brianchon son duales, y el dual del teorema de Desargues es 
precisamente su recíproco. Este fenómeno de la dualidad da a la 
geometría proyectiva un carácter muy distinto al que tiene la geome- 
tría métrica elemental, en la cual no existe tal dualidad (p. ej., carece 
de significado hablar del dual de un ángulo de 37% o de un segmento 
de longitud 2). En muchos textos de geometría proyectiva el principio 
de dualidad, que dice que el dual de todo teorema verdadero de geometría 
proyectiva es asimismo un teorema verdadero de geometría proyectiva, se 
pone de manifiesto colocando los teoremas duales junto con sus de- 
mostraciones duales en columnas paralelas de cada página, según he- 
mos hecho anteriormente. La razón básica de esta dualidad será con- 
siderada en la sección siguiente (véase también pág. 229). 


VI, REPRESENTACIÓN ANALÍTICA 


1. Observaciones preliminares.—En el desarrollo inicial de la geo- 
metría proyectiva existió una acusada tendencia a construirlo todo 
sobre una base sintética y puramente geométrica, evitando el uso de 
números y métodos algebraicos. Este programa tropezó con grandes 
dificultades, ya que siempre quedaban puntos donde parecía inevitable 
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alguna formulación. algebraica. Hacia los últimos años del siglo xIx 
se consiguió, no obstante, éxito completo en la construcción de una 
geometría proyectiva puramente sintética, pero a costa de gran com- 
plicación. En este sentido, los métodos de la geometría analítica han 
tenido mucho más éxito. La tendencia general en la matemática mo- 
derna es basarlo todo en el concepto de número; y, en geometría, esta 
tendencia, iniciada con Fermat y Descartes, ha obtenido triunfos de- 
cisivos. La geometría analítica se ha desarrollado desde el estadio de 
un mero instrumento de razonamiento geométrico hasta constituir 
una disciplina en la que la interpretación geométrica intuitiva de las 
operaciones y resultados no es ya el fin último y exclusivo, sino que 
tiene más bien la función de ser un principio director que ayuda a su- 
gerir y comprender los resultados analíticos. Este cambio en el signi- 
ficado de la geometría es el producto de un desarrollo histórico gra- 
dual que ha ampliado enormemente el objeto de la geometría clásica, 
y que, al propio tiempo, ha producido una unión casi orgánica de la 
geometría y el Análisis. 

En geometría analítica, las «coordenadas» de un ente geométrico 
son un conjunto de números que caracterizan a dicho objeto univoca- 
mente; p. ej., un punto se define dando sus coordenadas rectangulares 
zx, y o sus coordenadas polares p, 0, mientras un triángulo puede defi- 
nirse por las coordenadas de sus tres vértices, lo que requiere en total 
seis números. Sabemos que una recta en el plano x, y es el lugar geo- 
métrico de todos los puntos P (x, y) (véase pág. 83 para esta notación) 
cuyas coordenadas satisfacen a una ecuación lineal: 


ar+by+c0c=0. 11) 


Podremos, por consiguiente, designar los tres números a, b, c como 
las «coordenadas» de esta recta; p. ej., a = 0, b = 1, c = 0 definen la 
recta y = 0, que es el eje z; a = 1, b = 1, c = Q definen la recta r=y, 
que es la bisectriz del primer cuadrante. Del mismo modo, las ecua- 
ciones cuadráticas definen «secciones cónicas»: 


z? + y? = r? circunferencia de centro en el origen y 
radio r; 
(x — a}? + (y — b} = r2 circunferencia de centro en (a, b) y radio r; 
n= y 
az + p” 1 elipse, 
etcétera. 


El método que se ofrece como más natural en geometría analítica 
es partir de conceptos puramente «geométricos»—puntos, rectas, etc.— 
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y traducirlos al lenguaje de los números. El punto de vista moderno 
es el recíproco: partimos del conjunto de todos los pares de números 
(x, y), y llamamos punto a cada uno de dichos pares, ya que pode- 
mos, si es nuestro deseo, interpretar cada par de números por la 
noción familiar de punto geométrico. Análogamente, una ecuación 
lineal entre x e y se dice que define una recta. El haber transferido 
la atención principal del aspecto intuitivo de la geometría al analítico 
abre el camino para un tratamiento sencillo, aunque riguroso, de los 
puntos del infinito de la geometría proyectiva, lo que es indispensa- 
ble para una comprensión más profunda y completa de todo el tema. 
Para aquellos lectores que posean suficientes conocimientos prelimi- 
nares, daremos una breve descripción de este método. 

*2. Coordenadas homogéneas. Fundamento algebraico de la dua- 
lidad.—En geometría analítica ordinaria, las coordenadas rectangula- 
res de un punto del plano son sus distancias (con su correspondiente 
signo) a un par de ejes perpendiculares. El sistema falla cuando se 
consideran los puntos del infinito del plano ampliado de la geometría 
proyectiva. Por tanto, si deseamos aplicar los métodos analíticos a la 
geometría proyectiva, es necesario idear un sistema de coordenadas 
que comprenda tanto a los puntos ideales como a los ordinarios. La 
introducción de tal sistema de coordenadas se describe mejor supo- 
niendo que el plano X, Y(r) dado está «sumergido» en un espacio 
tridimension«ui, en el que se ha definido un sistema de coordenadas 
rectangulares x, y, z (o distancias afectadas de signo de un punto a los 
tres planos coordenados determinados *por los ejes x, y, z). Coloque- 
mos re paralelamente al plano coordenado r, y, y a una distancia 1 por 
encima de él, de forma que todo punto P de x tendrá coordenadas 
tridimensionales (X, Y, 1). Tomando el origen O del sistema de coor- 
denadas como centro de proyección, observemos que cada punto P 
determina una única recta que pasa por O, y recíprocamente (véase 
página 196. Las rectas que pasan por O y son paralelas a z corres- 
ponden a los puntos del infinito de 7). 

Vamos a describir ahora un sistema de «coordenadas homogéneas» 
para los puntos de x. Para hallar las coordenadas homogéneas de un 
punto ordinario P de x, consideramos la recta que une O con P y 
elegimos en ella un punto Q distinto del O (véase la Fig. 93). Enton- 
ces, las coordenadas tridimensionales x, y, z de Q son las coordenadas 
homogéneas de P. En particular, las coordenadas (X, Y, 1) de P mismo 
constituyen un conjunto de coordenadas homogéneas de P. Además, 
cualquier otro conjunto de números (tX, tY, t) con t 4 0 será también 
un conjunto de coordenadas homogéneas de P, ya que las coordenadas 
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de todos los puntos de la recta OP, excepto el O, serán de esta forma. 
[Excluímos el punto (0, 0, 0), que por estar en todas las rectas que 
pasan por O, no sirve para distinguir una de otra.] 

Este método de definir coordenadas en el plano requiere tres nú- 
meros en lugar de dos para determinar la posición de un punto, y 
tiene la desventaja adicional de que las coordenadas de un punto no 
están determinadas unívocamente, sino que incluyen un factor arbi- 
trario t, Pero ofrece la gran ventaja de que los puntos del infinito 
de r están ahora incluídos en la representación coordenada. Un punto 
P del infinito de re se determina mediante una recta que pasa por O 


2z 





FiG. 93.—Coordenadas homogéneas. 


y es paralela a z. Todo punto Q de esta recta tendrá coordenadas 
de la forma (x, y, 0); por consiguiente, las coordenadas homogéneas de 
un punto del infinito de v son de la forma (x, y, 0). 

La ecuación en coordenadas homogéneas de una recta de z puede 
hallarse inmediatamente, observando que las rectas que unen O con 
los puntos de esta recta están en un plano que pasa por 0. Se demues- 
tra en geometría analítica que la ecuación de tal plano es de la forma 


ar r by + cz = 0. 


Por tanto, esta es la ecuación en coordenadas homogéneas de una 
recta de x. i 
Ahora que el modelo geométrico de los puntos de x como rectas 
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que pasan por O ha cumplido su propósito, podemos dejarlo de lado y 
dar la siguiente definición, puramente analítica, del plano ampliado: 

Un punto es una terna ordenada de números reales (x, y, z), no 
todos iguales a cero. Dos de tales ternas (z1, Y1, 21) y (22, Y2, 22) definen 
el mismo punto, si para algún t Æ 0 es: 


t2 = tti, 
Y2 = tyi. 
za = tzi. 


En otras palabras, las coordenadas de. un punto cualquiera pue- 
den multiplicarse por un factor no nulo sin que varíe el punto. (Por 
esta razón se llaman coordenadas homogéneas.) Un punto (x, y, 2) es 
un punto ordinario si z Æ 0; si z = 0, es un punto del infinito. 

Una línea recta de v consta de todos los puntos (x, y, z) que satis- 
facen a una ecuación lineal de la forma 


ax + by + cz = 0, 119 


siendo a, b, c tres constantes no todas nulas. En particular, los pun- 
tos del infinito de r satisfacen todos a la ecuación lineal 


z=0. l [2] 


Ésta es, por definición, una recta llamada recta del infinito de n. 
Como una recta se define por una ecuación de la forma [1°], podemos 
llamar a la terna de números (a, b, c) coordenadas homogéneas de la 
recta [1°]. Sigue de ello que (ta, tb, tc), para cualquier t * 0, son tam- 
bién las coordenadas de la recta [1'], ya que la ecuación 


(tajx + (tb)y + (te)z = 0 [3] 


se satisface para las mismas ternas de coordenadas (x, y, z) que [1°]. 

En estas definiciones observamos una simetría perfecta entre punto 
y recta; cada uno de estos elementos está determinado por tres coor- 
denadas homogéneas (u, v, w). La condición para que el punto (z, y, 
z) esté en la recta (a, b, c) es que 


ax + by + cz = 0, 


y ésta es asimismo la condición para que el punto cuyas coordenadas 
son (a, b, c) esté en la recta de coordenadas (x, y, 2); p. ej., la identidad 
aritmética 

2:34+1:4-5:2=0 
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puede interpretarse tanto como que el punto (3, 4, 2) está en la recta 
(2, 1, —5) como que el punto (2, 1, —5) está en la recta (3, 4, 2). 
Esta simetría es la base de la dualidad entre punto y recta en geome- 
tría proyectiva, pues toda relación entre puntos y rectas se transforma 
en otra entre rectas y puntos cuando las coordenadas son adecuada- 
mente reinterpretadas. En la nueva interpretación, las coordenadas 
anteriores de puntos y rectas deberán imaginarse ahora como repre- 
sentando rectas y puntos, respectivamente. Todas las operaciones alge- 
braicas y resultados se conservan, pero su interpretación da la réplica 
dual del teorema original. Merece destacarse el hecho de que esta dua- 
lidad no se cumple en el plano ordinario de dos coordenadas X, Y, 
ya que la ecuación de una recta en coordenadas ordinarias 


ax +bYc=0 


no es simétrica respecto a X, Y y a, b, c. Sólo mediante la introduc- 
ción de los puntos y de la recta del infinito queda perfectamente esta- 
blecido el principio de dualidad. 


Para pasar de las coordenadas homogéneas x, y, z de un punto ordinario P 
del plano x a las coordenadas rectangulares ordinarias, hacemos simplemente 
X = xfz, Y = yjz. Entonces, X, Y representan las distancias desde el punto P 
a dos ejes perpendiculares de r, paralelos a los ejes x e y, según se indica en la 
figura 93. Sabemos que una ecuación de la forma 


aX +bY+4c=0 


representa una recta de x. Al efectuar la sustitución X = x/z, Y = y/z y multi- 
plicar por z encontramos que la ecuación de la misma recta en coordenadas ho- 
mogéneas es, como se ha dicho en la página anterior, 


ax + dy + cz =0. 


Por ejemplo, la ecuación de la recta 2r — 3y + z = 0 es, en coordenadas 
rectangulares ordinarias, X, Y, 2X — 3Y + 1 = 0. Naturalmente, la última ecua- 
ción falla para el punto del infinito de la recta, una de cuyas ternas de coordenadas 
homogéneas es (3, 2, 0). 

Queda aún algo por decir: hemos conseguido dar una definición puramente 
analítica de punto y recta; pero ¿cómo obtener el concepto igualmente impor- 
tante de transformación proyectiva? Puede demostrarse que una transformación 
proyectiva de un plano sobre otro, tal como se definió en la página 181, está dada 
analíticamente por un sistema de ecuaciones lineales 


xX = aiz + biy + Ciz, 


y = aax + bay + Cez, 14] 


z’ azr + bay + Csz, 


que relaciona las coordenadas homogéneas x', y”, 2” de los puntos del plano r’ 
con las coordenadas homogéneas zx, y, z de los puntos del plano m. Desde nuestro 
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punto de vista actual, podemos ahora definir una transformación proyectiva me- 
diante un sistema de ecuaciones lineales de la forma [4]. Los teoremas de la geo- 
metría proyectiva se transforman, por consiguiente, en teoremas sobre el compor- 
tamiento de las ternas de números (zx, y, z) bajo tales transformaciones; p. ej., la 
demostración de que la razón doble de cuatro puntos de una recta no varía al 
aplicar dichas transformaciones, es simplemente un ejercicio del álgebra de las 
transformaciones lineales. No entramos en los detalles de este procedimiento ana- 
lítico, y volveremos, en cambio, a los aspectos más intuitivos de la geometría 
proyectiva. 


VIL. PROBLEMAS DE CONSTRUCCIÓN CON LA REGLA 


En las construcciones siguientes se entiende que sólo se admite la regla como 
instrumento. 

Los problemas 1 a 18 están contenidos en una memoria de J. Steiner, en la 
cual prueba que puede prescindirse del compás en las construcciones geométricas 
cuando se da una circunferencia fija y su centro (véase Cap. III, pág. 163). Se 
aconseja al lector que resuelva los problemas en el orden dado. 

Una cuaterna de rectas a, b, c, d que pasan por un punto P se llama armónica 
si su razón doble (abcd) es igual a —1; a y b se dicen conjugados de c y d, y viceversa. 

1. Demuéstrese que si en una cuaterna armónica de rectas a, b, c, d, el rayo 
a es bisectriz del ángulo formado por c y d, b es entonces perpendicular a a. 

2. Constrúyase el cuarto rayo armónico de una terna dada de rectas que 
pasan por un punto. (Indicación: Hágase uso del teorema del cuadrilátero com- 
pleto.) 

3. Constrúyase el cuarto punto armónico de una terna de puntos colineales 
dados. a 

4. Se dan un ángulo recto y un ángulo arbitrario que tienen el vértice y un 
lado comunes; duplíquese este ángulo. 

5. Se da un ángulo y su bisectriz b. Constrúyase una perpendicular a b por 
el vértice del ángulo dado. 

6. Demuéstrese que si las rectas lı, le, la,- +., ln, que pasan por un punto 


P, cortan a la recta a en los puntos Ar, Ag, --+ +, An y a la recta b en los Bı, Ba, 
«+. , Bn, todas las intersecciones de los pares de rectas ABk y AyB1 (¡4 Kk; 
ide=.1,2,.--., n) están sobre una recta, 


7. Demuéstrese que si una paralela al lado BC del triángulo ABC corta a 
AB en B’ y a AC en C’, la recta que une A con la intersección D de B'C y C'B 
corta a BC en su punto medio. 

7a. Formúlese el recíproco de 7. 

8. Sobre una recta l se dan tres puntos, P, Q, R, tales que Q es el punto me- 
dio del segmento PR. Constrúyase una paralela'a | que pase por un punto dado S. 

9. Dadas dos rectas paralelas, l1 y la, hállese el punto medio de un segmento 
AB de l. 

10. Trácese una paralela a dos rectas paralelas dadas lı y lg y que pase por 
un punto dado P. (Indicación: Redúzcase 9 a 7 y úsese 8.) 

11. .Steiner da la solución siguiente al problema de duplicar un segmento 
rectilíneo A B, cuando se da una paralela l a AB: por un punto C, que no está en 
l ni en AB, se traza CA, que corta a l en Ay, y CB, que corta a l en By. Dibújese 
entonces (véase 10) una paralela a l que pase por C, la cual cortará a BA, en D. 
Si DB; encuentra a AB en E, AE = 2 * AB. Demuéstrese esto último. 


210 GEOMETRÍA PROYECTIVA. AXIOMÁTICA [cap. 4 





12. Divídase el segmento AB en n partes iguales, si se tiene trazada una 
paralela l a AB. (Indicación: Constrúyase primero el múltiplo n-ésimo de un seg- 
mento arbitrario de l, por medio de 11.) 

13. Dado un paralelogramo ABCD, trácese por un punto P una paralela a 
una recta dada l. (Indicación: Aplíquese 10 al centro del paralelogramo y úsese 8.) 

14. Dado un paralelogramo, multiplíquese un segmento dado por n. (Indi- 
cación: Úsense 13 y 11.) 

15. Dado un paralelogramo, divídase un segmento dado en n partes. 

16. Se da una circunferencia y su centro; trácese una paralela a una recta 
dada desde un punto dado. (Indicación: Utilicese 13.) 

17. Dados un círculo y su centro, multipliíquese y divídase un segmento dado 
por n. (Indicación: Utilicese 13.) 

18. Se da una circunferencia fija y su centro; trácese una perpendicular a 
una recta dada.por un punto dado. (Indicación: Úsese un rectángulo inscrito en 
la circunferencia y que tenga dos lados paralelos a la recta dada; redúzcase a 
ejercicios anteriores.) 

19. Utilizando los resultados de los problemas 1 a 18, ¿cuáles son los pro- 
blemas básicos de construcción que pueden resolverse sin otro instrumento que 
una regla con dos bordes paralelos? 

20. Dos rectas dadas, lı y lg, se cortan en un punto P fuera de los límites del 
papel. Constrúyase la recta que une un punto Q con P, (Indicación: Complétese 
con los elementos dados la;figura del teorema de Desargues para el plano, de forma 
que P y Q sean intersecciones de lados correspondientes de dos triángulos del 
teorema de Desargues.) 

21. . Constrúyase la recta que une dos puntos dados cuya distancia es mayor 
que la longitud de la regla utilizada (véase 20). 

22. Dos puntos P y Q, fuera de los límites del papel, están determinados por 
dos pares de rectas lı, la y mı, ma, respectivamente. Dibújese el segmento de la 
recta PQ que cae dentro del papel. (Indicación: Para obtener un punto de PQ, 
complétese la figura del teorema de Desargues, de manera que un triángulo tenga 
dos lados sobre lı y mı y los correspondientes del otro estén sobre la y my.) 

23. Resuélvase 20 por medio del teorema de Pascal (pág. 200). (Indicación: 
Complétese la figura correspondiente al teorema de Pascal considerando l; y la 
como un par de lados opuestos del hexágono y Q como intersección de otro par de 
lados opuestos.) 

*24. Dos rectas por completo fuera del papel están determinadas cada una 
por dos pares de rectas que se cortan en puntos exteriores al papel. Determínese 
el punto de intersección por medio de otro par de rectas que pasen por él. 


VIH. CÓNICAS Y CUÁDRICAS 


1. Geometría métrica elemental de las cónicas. —Hasta ahora nos 
hemos ocupado exclusivamente de puntos, rectas, planos y figuras 
formadas por combinaciones de estos entes. Si la geometría proyec- 
tiva consistiera únicamente en el estudio de esas figuras «lineales», 
tendría relativamente poco interés. Es un hecho de importancia fun- 
damental que la geometría proyectiva no se limita al estudio de las 
figuras lineales, sino que incluye también todo el campo de las sec- 
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ciones cónicas y sus generalizaciones a más de tres dimensiones. El 
estudio métrico de Apolonio de las tres secciones cónicas—elipse, hi- 
pérbola y parábola—fué uno de los grandes triunfos de la matemática 
de la antigüedad. Es difícil exagerar la importancia de las secciones 
cónicas tanto en la matemática pura como en la aplicada (p. ej., las 
órbitas de los planetas y las de los electrones en el átomo de hidrógeno 
son secciones cónicas). No debe extrañarnos que la teoría clásica griega 
de las secciones cónicas sea todavía parte indispensable de la enseñan- 
za matemática, pero de ninguna manera puede considerarse la mate- 
mática griega como algo definitivo. Dos mil años más tarde se descu- 
brieron las importantes propiedades proyectivas de las cónicas, y a pe- 
sar de su sencillez y belleza, la inercia académica ha impedido hasta 
ahora que se introduzcan en los programas de la segunda enseñanza. 

Vamos a empezar recordando las definiciones métricas de las sec- 
ciones cónicas. Existen varias de estas definiciones cuya equivalencia 
se demuestra en geometría elemental. La usual parte del concepto 
de focos. Se define una elipse como el lugar geométrico de todos los 
puntos P del plano tales que la suma de sus distancias, rı y r2, a dos 
puntos fijos, Fi y F2, llamados focos, es constante. (Si ambos focos 
coinciden, la figura es una circunferencia.) La hipérbola se define como 
el lugar geométrico de los puntos P del plano tales que el valor abso- 
luto de la diferencia ri — rz es igual a una constante prefijada. Y, 
finalmente, se define la parábola como el lugar geométrico de todos 
los puntos P del plano para los cuales la distancia r a un punto fijo 
F es igual a la distancia a una recta dada l. 

En geometría analítica todas estas curvas pueden expresarse me- 
diante ecuaciones de segundo grado entre las coordenadas x e y. No 
es difícil demostrar, recíprocamente, que cualquier curva definida 
analíticamente por una ecuación de segundo grado: 


art + by? + cy + de + ey + f= 0, 


es una recta, o un par de rectas, o una de las tres cónicas. Esto se 
demuestra, generalmente, introduciendo un sistema nuevo de coor- 
denadas más adecuado, como 'puede verse en cualquier curso de geo- 
metría analítica, 

Estas definiciones de las secciones cónicas son esencialmente mé- 
tricas, puésto que hacen uso del concepto de «distancia». Pero existe 
otra definición que establece el lugar que ocupan las secciones cóni- 
-cas en la geometría proyectiva. Las secciones cónicas son simplemente 
proyecciones de una circunferencia sobre un plano. Si proyectamos una 
circunferencia C desde un punto O, todas las rectas proyectantes for- 
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marán un doble cono indefinido, cuya intersección con un plano x 
será la proyección de C. Esta intersección será una elipse o una hi- 
pérbola, según que el plano corte a una o a ambas hojas del cono. El 
caso intermedio de la parábola aparece cuando m es paralelo a una 
de las rectas que pasan por O (Fig. 94). 

Este cono de proyección no precisa ser circular recto con su vér- 
tice O en la perpendicular levantada sobre el centro del círculo C; 
puede ser también oblicuo, En cualquier caso, y por ahora lo acep- 
taremos sin demostración, la intersección de un cono con un plano 





Fic. 94.—Secciones cónicas, 


es una curva cuya ecuación es de segundo grado; recíprocamente, 
toda curva de segundo grado puede deducirse de una circunferencia 
por proyección. Por esta razón, las curvas de segundo grado se lla- 
man secciones cónicas. 

Hemos dicho que cuando el plano corta sólo a una hoja de un cono 
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circular recto, la curva de intersección E es una elipse. Podemos de- 
mostrar que E satisface la definición focal ordinaria de la elipse, tal 
como se ha dado antes, mediante una elegante argumentación debida 
al matemático belga G. P. Dandelin, quien la enunció en 1822. La 





Fic. 95.—Esferas de Dandelin, 


demostración se basa en la introducción de dos esferas S1 y S2 (Fig. 95), 
que son tangentes a z en los puntos F; y F2, respectivamente, y tan- 
gentes al cono a lo largo de dos circunferencias situadas en planos 
paralelos Kı y Ka, respectivamente. Unamos un punto cualquiera P 
de E con F; y Fz, y tracemos la recta que une P con el vértice O del 
cono, Esta recta es una generatriz de la superficie cónica y encuentra 
a las circunferencias Kı y Kə en los puntos Qı y Q2, respectivamente. 
Como PF, y PQ, son dos tangentes desde P a Sı, se tiene: 


PF, = PQ1, 
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y, análogamente, 
PFs = PQs. 


Sumando ambas igualdades miembro a miembro, resulta: 


PF, + PF3 = PQ1 + PQ: = Q10s, 


que es precisamente la distancia, contada sobre las generatrices del 
cono, entre los dos círculos paralelos Kı y Ka, por lo cual resulta 
independiente de la particular elección del punto P sobre E. La ecua- 
ción resultante 

PF, + PF; = constante, 


válida para todos los puntos P de E, es, precisamente, la definición fo- 
cal de la elipse. En consecuencia, E es una elipse y Fi, F2, sus focos. 


Ejercicio: Cuando un plano corta las dos hojas de un cono, la curva de inter- 
sección es una hipérbola. Demuéstrese esta propiedad, utilizando una esfera en 
cada una de las hojas del cono. 


2. Propiedades proyectivas de las cónicas. —Basándonos en los he- 
chos acabados de exponer, adoptaremos la siguiente definición provi- 
sional: una cónica es la proyec- 
ción. de una circunferencia sobre 
un plano. Esta definición está 
más de acuerdo con el espíritu 
de la geometría proyectiva que 
la definición focal ordinaria, 
puesto que esta última se basa 
por entero en la noción métrica 
de distancia. Ni siquiera nuestra 
actual definición está libre de 
ese defecto, ya que la «circun- 
ferencia» es un concepto de 
geometría métrica. En seguida 

daremos una definición pura- 

Fra, 96.—Razones dobles en una circun- mente proyectiva de las cónicas. 
Dado que nos hallamos de 

acuerdo con que una cónica es la proyección de una circunferencia 
(con la palabra «cónica» designamos cualquier curva de la clase pro- 
yectiva de la circunferencia; véase pág. 198), se deduce que cualquier 
propiedad de la circunferencia que permanezca invariante en la pro- 
yección será también una propiedad de las cónicas. Ahora bien: la 
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circunferencia tiene una propiedad (métrica) muy conocida, la de que 
un arco dado subtiende el mismo ángulo desde todo punto O de aqué- 
lla. En la figura 96, el ángulo AOB, subtendido por el arco AB es 
independiente de la posición de O. Puede relacionarse este hecho con 
el concepto proyectivo de razón doble, considerando no dos puntos 
A y B, sino cuatro A, B, C, D de la circunferencia. Las cuatro semi- 
rrectas a, b, c, d, que los unen a un quinto punto O de aquélla tendrán 
una razón doble (a, b, c, d) que dependerá exclusivamente de los ángu- 
los subtendidos por los arcos CA, CB, DA, DB. Si unimos. A, B,C,D 
con otro punto O” de la circunferencia, obtendremos. cuatro rayos a”, 
b', e”, d'. De acuerdo con la propiedad que acabamos de mencionar, 
ambas cuaterrias de rayos serán 
«congruentes» 1; o sea, tendrán la 
misma razón doble (a', b', c, 
d') = (a, b, c, d). Si ahora pro- 
yectamos la circunferencia en 
una cónica K, obtendremos cua- 
tro puntos sobre K que llama- 
remos A, B, C, D, otros dos 
puntos 'O y O' y dos cuaternas 
de rayos a,b,c,d y d,b,c,d'. 
Éstas no serán congruentes, Fic. 97.—Razones dobles en una elipse. 

puesto que, en general, la pro- 

yección no conserva la igualdad de los ángulos, Pero, ya que la razón 
doble permanece invariante en la proyección, la igualdad (a, b, c, d)= 
=(a, b', c', d’) seguirá siendo válida. Esto nos conduce al teorema 
fundamental: Si se unen cuatro puntos cualesquiera A, B, C, D de una 
cónica K con un quinto punto O de K mediante las rectas a, b, c, d, la 
razón doble (a, b, c, d) es independiente de la posición de O sobre K 
(Figura 97). 

Es éste en verdad un resultado notable; ya sabíamos que cuatro 
puntos cualesquiera de una recta dan lugar a la misma razón doble 
desde cualquier quinto punto exterior O. Este teorema sobre razones 
dobles es el hecho fundamental en geometría proyectiva. Vemos ahora 
que sigue siendo válido para cuatro puntos de una cónica, con una 
importante restricción; el quinto punto no puede ser uno cualquiera 
del plano, aunque puede moverse libremente sobre la cónica dada. 

No es difícil probar el teorema recíproco, que aparece en la siguiente 





1 Una cuaterna de rayos, a, b, c, d, se dice congruente con otra a’, b', e”, d', si el án- 
gulo de cada par de rayos de la primera cuaterna es igual y tiene el mismo sentido que el 
correspondiente en la segunda cuaterna. 
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forma: si dos puntos O y O” de una curva K son tales que cualquier 
cuaterna de puntos A, B, C, D de K tiene la misma razón doble, 
tanto desde O como desde O”, K es una cónica (y, en consecuencia, 
A, B, C, D tienen la misma razón doble desde un tercer punto cual- 
quiera 0” de K). Omitimos la demostración. 

Estas propiedades proyectivas de las cómicas sugieren un método 
general para construirlas. Llamaremos haz de rectas al conjunto de 
todas las rectas de un mismo plano que pasan por un punto O. Con- 
sideremos ahora dos haces de vértices O y O”, elegidos sobre la cóni- 
ca K. Podemos establecer una correspondencia biunívoca entre las 
rectas del haz O y las del haz 0”, haciendo corresponder a toda recta 
a de O, otra a' de O”, siem- 
pre que a y a se corten en 
un punto A de la cónica K. 
Entonces, cuatro rayos cua- 
lesquiera a, b, c, d del haz O 
tendrán la misma razón do- 
ble que los cuatro rayos co- 
rrespondientes a”, b’, e”, d' de 
O'. Cualquier corresponden- 
cia biunívoca entre dos haces 

i " de rectas, que tenga esta 

Fio, Pecon raciigi de hacet relacionados propiedad, se llama corres- 

pondencia proyectiva. (Evi- 
dentemente, esta definición es dual de la dada en la pág. 190 para 
la correspondencia proyectiva entre los puntos de dos rectas.) Se 
dice que dos haces están relacionados proyectivamente cuando se es- 
tablece entre ellos una correspondencia proyectiva; con esta definitión 
podemos afirmar ahora que la cónica K es el lugar geométrico de las 
intersecciones de los rayos correspondientes de dos haces relaciona- 
dos proyectivamente. Este teorema nos procura la base para una de- 
finición puramente proyectiva de las cónicas: Una cónica es el lugar 
geométrico de las intersecciones de los rayos correspondientes de dos haces 
relacionados proyectivamente1!. Es tentador seguir el camino hacia la 
teoría de las cónicas que nos abre esta definición, pero nos limitare- 
mos a unas pocas observaciones. 

Pueden obtenerse pares de haces, relacionados proyectivamente, 
de la manera siguiente: proyectemos todos los puntos P de una recta l 
desde dos centros diferentes O y O”; en los haces proyectantes esta- 





2 ES lugar puede degenerar, en determinadas circunstancias, en una recta (véase 
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blezcamos una correspondencia entre las rectas a y a” que se cortan 
sobre l. Ambos haces estarán entonces relacionados proyectivamente. 
Tomemos ahora el haz O” y transportémoslo rígidamente a cualquier 
otra posición O”; el haz resultante O” estará relacionado proyectiva- 
mente con el O. Por otra parte, de esta manera puede obtenerse cual- 
quier correspondencia proyectiva entre los haces. (Este hecho es dual 
del ejercicio 1, pág. 190.) Si los haces O y O” son congruentes, obte- 
nemos una circunferencia. Si los ángulos son iguales, pero de sentido 
opuesto, la cónica es una hipérbola equilátera (Fig. 99). 

Obsérvese que esta definición de cónica puede conducir a un lugar 
que es una recta, como en la figura 98. En este caso, la recta 00” se 
corresponde a sí misma y se admite que todos sus puntos pertenecen 





Fia, 99,—Generación de la circunferencia e hipérbola equilátera mediante 
haces proyectivos, 


al lugar. Por tanto, la cónica degenera en un par de rectas, lo que 
está de acuerdo con la existencia de secciones de un cono (las obteni- 
das por planos que pasan por el vértice) que se componen de dos rectas. 


Ejercicios: 

1. Dibújense elipses, hipérbolas y parábolas mediante haces proyectivos. (Se 
aconseja al lector que se habitúe a estas construcciones, pues contribuirán mucho 
a una comprensión perfecta del tema.) . 

2. Dados cinco puntos O, O”, A, B, C, de una cónica desconocida K, se desea 
determinar el punto D en el que una recta dada d, que pasa por O, corta a K. 
(Indicación: Considérense los rayos a, b, c, que pasan por O, dados mediante OA, 
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OB, OC, y, análogamente, los rayos a”, b, c”, que pasan por O”, Trácese por O el 
rayo d y constrúyase por O” el rayo d’ tal que (a, b, c, d) = (a', b’, c”, d’). La in- 
tersección de d y d' es necesariamente un punto de K.) 


3. Las cónicas como envolventes. —El concepto de tangente a una 
cónica pertenece a la geometría proyectiva, pues se trata de una 





Fe. 100.—La circunferencia, definida por el 


conjunto de sus tangentes. 


recta que tiene con la cónica 
un solo punto común, pro- 
piedad que se conserva en la 
proyección. Las propiedades 
proyectivas de las tangentes 
a las cónicas se basan en el 
siguiente teorema fundamen- 
tal: la razón doble de los pun- 
tos de intersección de cuatro 
tangentes fijas a una cónica 
con una quinta tangente, es la 
misma para cualquier posi- 
ción de esta última. 

La demostración de este 
teorema es muy sencilla; pues- 
to que una cónica es la pro- 
yección de una circunferen- 


cia, y dado que el teorema se refiere únicamente a propiedades que 
permanecen invariantes en la proyección, bastará demostrarlo para 
la circunferencia, y quedará así establecido en general. Para la cir- 
cunferencia el teorema es sólo un problema de geometría elemental. 





Frio. 101.—Propiedad tangencial de la circunferencia. 
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Sean P, Q, R, S cuatro puntos cualesquiera de una circunferencia K, 
siendo a, b, c, d las tangentes correspondientes. Sea T otro punto con 
tangente o, que corta a a, b, c, d en A, B, C, D. Si M es el centro de 


la circunferencia, se tendrá evidentemente que TMA = 1/2 TM] P, sien- 
do este último igual al ángulo subtendido por el arco TP desde un 


punto de K. Análogamente, TMB es el ángulo subtendido por el 
arco TQ desde un punto de K. En consecuencia, AMB = 1/2PQ, 


siendo 1a PÒ el ángulo subtendido por el arco PQ desde un punto de 
K. De ahí que los puntos A, B, C, D se proyecten desde M en cuatro 





Fic. 102,—Series proyectivas de puntos sobre dos tangentes de una elipse, 


rayos, cuyos ángulos están dados por las posiciones fijas de P, Q, R, S. 
Resulta, por tanto, que la razón doble (ABCD) depende sólo de las 
cuatro tangentes a, b, c, d y no de la posición particular de la quinta 
tangente o. Éste es exactamente el teorema que queríamos demostrar. 

En la sección precedente hemos visto que podía construirse una 
cónica mediante los puntos de intersección de las rectas correspon- 
dientes de dos haces proyectivos. El teorema que acabamos de demos- 
trår nos permite dar la construcción dual. Sean dos tangentes a y al 
de una cónica K. Otra tercera tangente £ cortará a a y a' en dos pun- 
tos A y A”, respectivamente. Si £ se mueve sobre la cónica, quedará 
establecida una correspondencia A <—> A” entre los puntos de a y 
los de a’; esta correspondencia es proyectiva, pues de acuerdo con 
nuestro teorema cuatro puntos cualesquiera de a tendrán la misma 
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razón doble que los correspondientes de a'. Resulta de ello que una 
cónica K, considerada como el conjunto de sus tangentes, se compone 
de las rectas que unen los pares de puntos correspondientes de las dos 





Frio. 104.—La parábola definida por series semejantes de puntos. 


series} de puntos proyectivos sobre a y a'. Puede utilizarse esta propie- 
dad para dar una definición proyectiva de las cónicas como «envol- 
ventes de rectas». Comparémosla con la definición proyectiva de có- 
nica, dada en la sección precedente: 


1 El conjunto de puntos de una recta se llama serie de puntos. Es el concepto dual 
de haz de rectas, 
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I. Una cónica es un conjunto H. Una cónica es un conjunto 
de puntos, formado por los pun- | de rectas, formado por las rectas 
tos de intersección de las rectas | que unen los puntos correspon- 
correspondientes de dos haces | dientes de dos series proyectivas 
proyectivos de rayos. de puntos. 


Si tomamos la tangente a una cónica en un punto cualquiera 
como el elemento dual del propio punto de contacto, y si considera- 
mos una curva «envolvente» (conjunto de todas sus tangentes) como 
dual de una curva «puntual» (conjunto de todos sus puntos), es evi- 
dente la completa dualidad de ambas proposiciones. En la traducción 
de un enunciado a otro, reemplazando cada concepto por su dual, 
la voz «cónica» no varía; en un caso es una «cónica puntual», definida 
por sus puntos; en el otro, una «cónica envolvente», definida por sus 
tangentes (véase la Fig. 100). 

Una consecuencia importante de este hecho es que el principio 
de dualidad de la geometría proyectiva plana, enunciado inicialmente 
sólo para puntos y rectas, puede ahora generalizarse hasta compren- 
der a las cónicas. Si, en el enunciado de un teorema cualquiera relativo 
a puntos, rectas y cónicas, se reemplaza cada elemento por su dual (re- 
cordando que el dual de un punto de una cónica es la tangente a la 
misma) el resultado será también cierto. Un ejemplo de aplicación de 
este principio lo hallaremos en el artículo siguiente. 

La construcción de las cónicas como envolventes se ilustra en las 
figuras 103 y 104, Si en las dos series proyectivas de puntos se corres- 
ponden entre sí los dos puntos del infinito (como debe ocurrir en 
series congruentes! o semejantes), la cónica será una parábola; el 
teorema recíproco es también cierto. 


Ejercicio: Demuéstrese el teorema recíproco: sobre dos tangentes fijas cuales- 
quiera de una parábola, una tangente móvil determina dos series de puntos se- 
mejantes. 


4. Los teoremas generales de Pascal y Brianchon para las cónicas. 
«Uno de los más interesantes ejemplos del principio de dualidad para 
las cónicas es la relación entre los teoremas generales de Pascal y 
Brianchon. El primero fué descubierto en 1640, y el segundo en 1806. 
Sin embargo, el uno es consecuencia inmediata del otro, ya que cual- 
quier teorema que se refiera exclusivamente a cónicas, rectas y pun- 
tos sigue verificándose si se Sustituye por el eriunciado dual. 

Los teoremas dados en las páginas 200 y 202 bajo la misma denomi- 


1 Es obvio lo que se quiere decir por correspondencia congruente o semejante entre dos 
series de puntos. 


COURANT.—9 
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nación son casos especiales de los siguientes teoremas más gene- 
rales: 

Teorema de Pascal: Los lados opuestos de un hexágono inscrito 
en una cónica se encuentran en tres puntos alineados. 

Teorema de Brianchon: Las tres diagonales que unen los vértices 
opuestos de un hexágono circunscrito a una cónica son concurrentes. 

Es obvio que ambos teoremas son de carácter proyectivo. Su dua- 
lidad se hace evidente en cuanto se formulan como sigue: 

Teorema de Pascal: Dados seis puntos 1, 2, 3, 4, 5, 6, de una có- 
nica, se unen los puntos sucesivos mediante las rectas (1, 2), (2, 3), 





Fia. 105.—Configuúración general de Pascal dos hexágonos (1, 2, 3, 4, 5, 6) 
c y (1,3,5,2,4, 4). a mas 


(3, 4), (4, 5), (5, 6), (6, 1). Si se hallan los puntos de intersección de 
(1, 2) con (4, 5); de (2, 3) con (5, 6), y de (3, 4) con (6, 1), dichos tres 
puntos de intersección se encuentran sobre una misma recta. 
Teorema de Brianchon: Dadas seis tangentes 1, 2, 3, 4, 5, 6, a una 
cónica, se hallan los puntos de intersección de las tangentes sucesivas 
(1, 2), (2, 3), (3, 4), (4, 5), (5, 6), (6, 1). Si se trazan las rectas que 
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Fia. 107.—Demostración del teorema de Pascal. 
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unen (1, 2) con (4, 5); (2, 3) con (5, 6), y (3, 4) con (6, 1), dichas tres 
rectas pasan por un mismo punto. 

Las demostraciones resultan de una particularización análoga a 
la que se utilizó en los casos degenerados, Para demostrar el teorema 
de Pascal, sean A, B, C, D, E, F los vértices de un hexágono inscrito 
en una cónica K. Mediante una proyección, podemos hacer que AB 
sea paralela a ED y FA paralela a CD, con lo que obtenemos la con- 
figuración representada en la figura 107, (Para mayor comodidad se 
ha representado el hexágono como si se cortara a sí mismo, aunque 
esto no es necesario.) El teorema de Pascal se reduce ahora a la sen- 
cilla proposición de que CB es paralela a FE, o dicho de otra ma- 
nera, que la recta sobre la cual se hallan las intersecciones de los 
lados opuestos del hexágono es la recta del infinito. Para demostrarlo, 
consideremos los puntos F, A, B, D, que, como ya sabemos, se 
proyectan mediante cuatro rayos cuya razón doble es constante, k, 
desde cualquier otro punto de K, p. ej., desde C o desde E. Proyec- 
temos estos puntos desde C; entonces, los rayos proyectantes cortan 
a AF en cuatro puntos F, A, Y, oo, cuya razón doble es k. O sea, 
que YF: YA = k (véase pág. 197). Si se proyectan las mismos pun- 
tos desde E sobre BA, se tiene: 


k = (XAB œ) = BX : BA. 
Por tanto, l 
BX : BA = YF: YA, 


con lo que queda establecido el paralelismo de YB y FX. Esto com- 
pleta la demostración del teorema de Pascal. 

El teorema de Brianchon se deduce, sea mediante el principio de 
dualidad o por un razonamiento directo dual del anterior. Será un ex- 
celente ejercicio para el lector establecer con detalle la demostración. 

5. hiperboloide.—Las figuras que corresponden en tres dimen- 
siones a las cónicas del plano son las «cuádricas», entre las cuales la 
esfera y el elipsoide son casos especiales. Estas superficies ofrecen 
mayor variedad y su estudio resulta considerablemente más difícil 
que el de las cónicas. Aquí estudiaremos brevemente, y sin dar las 
demostraciones, una de las cuádricas más interesantes: el «hiperbo- 
loide de una hoja». 

Esta superficie puede definirse de la siguiente forma: elíjanse tres 
rectas cualesquiera, lı, lz, lg, sin ninguna particularidad en cuanto a 
su posición en el espacio; es decir, tales que dos cualesquiera de ellas 
no sean concurrentes o paralelas, ni que las tres sean paralelas a un 
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Fic. 108.—Construcción de rectas que se apoyan en tres dadas en posición general. 


mismo plano. Es sorprendente que existan infinitas rectas en el espa- 
cio que se apoyan en las tres dadas. Para ver esto, tomemos un plano 
cualquiera r que pase por lı. Entonces, r cortará a lg y lg en dos pun- 
tos, y la recta m que los une 
cortará a lı, la y lg, engendrando 
una superficie indefinida, que 
es el hiperboloide de una hoja, 
el cual contiene una familia 
infinita de rectas de la clase m. 
Cualquier terna de estas rectas 
M1, Mg, Mg estará también en 
posición general, y todas las 
rectas del espacio que corten a 
estas tres se hallarán conteni- 
das en la superficie del hiper- 
boloide. Ésta es la propiedad 
fundamental de esta superficie: 
está compuesta de dos familias 
diferentes de rectas; cada tres 
de la misma familia están en 
posición general, mientras cada 
recta de una familia corta a 
todas las de la otra. 

Una importante propiedad Fic. 109,—El hiperbololde. 
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proyectiva del hiperboloide consiste en que la razón doble de cua- 
tro puntos, intersecciones de cuatro rectas cualesquiera de una fami- 
lia con una de la otra, es independiente de la posición de esta última. 
Esto se deduce directamente del método de construcción del hiperbo- 
loide mediante un plano que gira, lo que puede demostrar el lector 
como ejercicio. : 

Una de las-propiedades más notables del hiperboloide es la de que, 
si bien contiene dos familias de rectas que se cortan, esto no hace 
que la superficie sea rígida. Si se construye un modelo con alambres 
que puedan girar libremente en los puntos de intersección, puede 
deformarse la figura de manera continua, adquiriendo una gran varie- 
dad de formas. 


IX. AXIOMÁTICA Y GEOMETRÍA NO EUCLÍDEA 


1. El método axiomático.—El método axiomático en matemáticas 
se remonta por lo menos a Euclides. De ningún modo es cierto que la 
matemática griega estuviese desarrollada o presentada exclusivamente 
en la forma rígida de postulados de los Elementos. Pero tan grande 
fué la impresión producida por este trabajo sobre las generaciones 
subsiguientes, que se transformó en un modelo para toda demostra- 
ción rigurosa en matemáticas. A veces hasta los filósofos como, per 
ejemplo, Spinoza en su Ethica, more geometrico demonstrata, trató de 
presentar sus argumentos en forma de teoremas deducidos de defini- 
ciones y axiomas. En la matemática moderna, después de un aleja- 
miento de la tradición euclídea durante los siglos xvir y xvi, hubo 
una creciente penetración del método axiomático en todos los cam- 
pos. Uno de los resultados más recientes ha sido la creación de una 
nueva disciplina: lá lógica matemática. 

En términos generales, el punto de vista axiomático puede des- 
cribirse como sigue: Probar un teorema en un sistema deductivo 
consiste en hacer ver que el teorema es una consecuencia lógica y ne- 
cesaria de ciertas proposiciones previamente establecidas, que a su vez 
deben ser probadas, y así sucesivamente. El proceso de demostración 
matemática sería, por tanto, una tarea imposible de regresión infinita, 
salvo que, en esta marcha hacia atrás, esté permitido detenerse en 
algún punto. Por tanto, debe. de haber un número de proposiciones, 
llamadas postulados o axiomas, que son aceptadas como verdaderas, 
y para las cuales no se requiere ninguna demostración. De éstas pode- 
mos intentar deducir todos los teoremas por medio de argumentos 
puramente lógicos. Si los hechos de un campo científico pueden colo- 
carse en un orden lógico tal que sea posible deducir todo de un cierto 
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número de aserciones previamente elegidas (preferiblemente pocas, 
sencillas y adecuadas), entonces se dice que ese campo está presentado 
en forma axiomática. La elección de las proposiciones aceptadas como 
axiomas es en gran medida arbitraria; pero poco se gana con el mé- 
todo axiomático, si los postulados no son simples y no demasiado 
numerosos. Además, los postulados deben ser compatibles, en el sen- 
tido de que no puedan deducirse de ellos dós teoremas contradictorios 
entre sí; y suficientes, de tal modo que todo teorema del sistema sea 
deducible de ellos. Por razones de economía es también deseable que 
los postulados sean independientes, en el sentido de que ninguno de 
ellos sea una consecuencia lógica de los restantes. 

La cuestión de la compatibilidad y dela suficiencia de un conjunto 
de axiomas ha sido objeto de mucha controversia. Diferentes convic- 
ciones filosóficas concernientes a los últimos cimientos del conoci- 
miento humano han llevado a actitudes aparentemente irreconcilia- 
bles sobre los fundamentos de la matemática. Si los entes matemáticos 
son considerados como objetos sustanciales en un reino de «pura in- 
tuición», independientes de las definiciones y de los actos individuales 
de la mente humana, entonces, por supuesto, no puede haber contra- 
dicciones, ya que los hechos matemáticos son aserciones objetivamente 
verdaderas, que describen realidades'*existentes. Desde este punto 
de vista «kantiano», no hay problema de compatibilidad. Por desgra- 
cia, sin embargo, el cuerpo efectivo de la matemática no puede ser 
adaptado a un sistema filosófico tan simple. Los modernos matemáti- 
cos intuicionistas no confían en la intuición pura en el vasto sentido 
kantiano. Aceptan el infinito numerable como hijo legítimo de la 
intuición, y admiten sólo propiedades constructivas; pero de este 
modo, conceptos básicos, como el continuo numérico, serían desterra- 
dos; partes importantes de la matemática excluídas, y el resto deses- 
peradamente complicado. 

Muy diferente es el punto de vista adoptado por los «formalistas». 
Éstos no atribuyen una realidad intuitiva a los objetos matemáticos, 
ni proclaman que los axiomas expresan verdades obvias concernien- 
tes a las realidades de la intuición pura; su interés radica sólo en el 
procedimiento lógico formal del razonamiento sobre la base de los 
postulados. Esta actitud tiene una definida ventaja sobre el intuicio- 
nismo, puesto que garantiza a la matemática toda la libertad necesa- 
ria para la teoría y las aplicaciones. Pero ello impone al formalista la 
necesidad de probar que sus axiomas, que ahora parecen creaciones 
arbitrarias de la mente humana, no pueden llevarnos a una contra- 
dicción. Se han realizado grandes esfuerzos durante los últimos 
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veinte áños para encontrar tales pruebas de compatibilidad, al menos 
para los axiomas de la aritmética y del álgebra, y para el concepto 
del continuo numérico. Los resultados son altamente significativos, 
pero. el triunfo está todavía lejos. Realmente, los resultados recientes 
indican qué tales esfuerzos no pueden ser completamente satisfacto- 
rios, en el sentido de que las pruebas de compatibilidad y suficiencia 
no son posibles dentro de sistemas estrictamente cerrados de concep- 
tos. Es digno de observarse que en todos estos argumentos acerca de 
los fundamentos se procede por métodos que son enteramente cons- 
tructivos en sí mismos y dirigidos por esquemas intuitivos. 

Acentuado por las paradojas de la teoría de conjuntos (cap. LI, 
pág. 96), el conflicto entre intuicionistas y formalistas obtuvo gran 
publicidad por obra de apasionados partidarios de ambas escuelas. El 
mundo matemático fué sacudido por el grito de «crisis en los funda- 
mentos»; pero la alarma no era, y no debe ser, tomada demasiado en 
serio. Aun reconociendo todo el mérito debido a los resultados obte- 
nidos en la lucha por la depuración de los fundamentos, sería comple- 
tamente injustificado inferir que el cuerpo vivo de la matemática 
haya sido siquiera amenazado por tales diferencias de opinión o por 
paradojas inherentes a una incontrolada tendencia hacia la generali- 
zación ilimitada. 

Aparte de las consideraciones filosóficas y del interés en los fun- 
damentos, el método axiomático en matemática resulta el camino 
natural para desenredar la madeja de interconexiones entre los distin- 
tos hechos, y para demostrar el esqueleto lógico esencial de la estruc- 
tura. Sucede a veces que tal concentración en la estructura formal, 
con preferencia al significado intuitivo de los conceptos, hace más 
fácil dar con generálizaciones y aplicaciones que podrían haber pasado 
inadvertidas de haber utilizado un método más intuitivo. Pero rara 
vez se obtiene un descubrimiento significativo o una visión esclare- 
cedora si se hace uso de un procedimiento exclusivamente axiomá- 
tico. El pensamiento. constructivo, guiado' por la intuición, es la ver- 
dadera fuente de la dinámica matemática. A pesar de que la forma 
axiomática es un ideal, es una peligrosa falacia creer que la axiomá- 
tica constituye la esencia de la matemática. La intuición constructi- 
va de los matemáticos da a esta ciencia un elemento no deductivo 
e irracional que la hace comparable con la música y el arte. 

Desde los días de Euclides, la geometría ha sido el prototipo. de 
una disciplina axiomatizada. Durante siglos, el sistema de axiomas 
de Euclides ha sido objeto de estudio intensivo. Pero sólo reciente- 
mente se ha puesto de manifiesto que sus postulados debían ser modi- 
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ficados y completados si se deseaba que toda la geometría elemental 
fuera deducible de ellos. En las postrimerías del siglo x1x, por ejemplo, 
Pasch descubrió que el orden de los puntos sobre una recta, la noción 
de «entre», requiere un postulado especial. Pasch formuló la siguiente 
proposición como nuevo axioma: Una recta que corta un lado de un 
triángulo en cualquier punto distinto de un vértice debe cortar tam- 
bién a otro lado del triángulo, (Pasar por alto tales detalles lleva a 
muchas aparentes paradojas, eñ las que consecuencias absurdas 
—p. ej., la conocida «demostración» de que todo triángulo es isósceles— 
parecen deducirse rigurosamente.de los axiomas de Euclides. Esto se 
debe, por lo general, a figuras mial dibujadas, cuyas líneas parecen 
interceptar interior o exteriormente a ciertos triángulos o circunfe- 
rencias, cuando en realidad no ló hacen.) 

En su famoso libro Grundlagen der Geometrie1 (la primera edición 
fué publicada en 1901), Hilbert dió un conjunto satisfactorio de axio- 
mas para la geometría, y al propio tiempo hizo un estudio exhaustivo 
de su mutua independencia, compatibilidad y suficiencia. 

En todo sistema de axiomas deben entrar ciertos conceptos no 
definidos, como punto y recta en geometría. Su «significado» o relación 
con objetos del mundo físico no es matemáticamente esencial, Pueden 
ser considerados como entes puramente abstractos, cuyas propieda- 
des matemáticas en un sistema deductivo están dadas completamente 
por las relaciones existentes entre ellos, enunciadas por los axiomas; 
p. ej., en geometría proyectiva podemos comenzar con los conceptos 
no definidos de punto, recta e incidencia o pertenencia y con los dos 
axiomas duales: «Dos puntos distintos cualesquiera pertenecen a una 
sola recta» y «dos rectas distintas cualesquiera inciden en un solo 
punto». Desde el punto de vista de la axiomática, la forma dual de 
tales axiomas es la verdadera fuente del principio de dualidad de la 
geometría proyectiva. Todo teorema que contenga en su enunciado 
y en su demostración sólo elementos relacionados por axiomas dua- 
les, debe admitir otro teorema dual. En efecto, la demostración del 
teorema original consiste en la aplicación sucesiva de ciertos axiomas, 
y la aplicación de los axiomas duales en el mismo orden debe darnos 
la demostración del teorema dual. 

La totalidad de los axiomas de la geometría nos da la definición 
implícita de todos los términos geométricos «no definidos», como «recta», 
«punto», «incidencia», etc. Para las aplicaciones, es importante el he- 
cho de que los conceptos y los axiomas de la geometría se correspon- 


1 Existe edición española: Fundamentos de la Geometría, trad. de F, Cebrián. Instituto 
Jorge Juan de Matemáticas, C.S.I.C., Madrid. 
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dan con aserciones físicamente verificables acerca de objetos «reales», 
tangibles. La realidad física a que alude el concepto de «punto» es la 
de cualquier objeto muy pequeño, como la huella de un lápiz; mien- 
tras una «recta» es una abstracción hecha a partir de un hilo tenso o 
un rayo de luz. La experiencia nos dice que las propiedades de estos 
puntos y rectas físicas concuerdan grosso modo con los axiomas for- 
males de la geometría. Cabe concebir que experimentos mucho más 
precisos puedan plantear la necesidad de modificar esos axiomas si 
éstos han de ser adecuados para describir los fenómenos físicos. Pero 
si los axiomas formales no concuerdan aproximadamente con las pro- 
piedades de los objetos físicos, entonces la geometría apenas tendría 
interés. Así, incluso para los formalistas, hay una autoridad aparte de la 
mente humana que decide la dirección del pensamiento matemático. 

2. Geometría no euclidea hiperbólica.—Hay un axioma de la geo- 
metría euclídea cuya «verdad», o sea, cuya correspondencia con datos 
empíricos acerca de hilos tensos o rayos de luz, no es de manera alguna 
evidente. Se trata del famoso postulado de la paralela única, el cual 
establece que por un punto exterior a una recta dada se puede trazar 
una, y sólo una, paralela a la misma. El rasgo característico de este 
postulado consiste en que hace una aserción acerca de toda la exten- 
sión de una recta, imaginada como indefinida en ambas direcciones; 
ya que decir que dos rectas son paralelas equivale a afirmar que no 
se cortan nunca, por mucho que se las prolongue. No está de más 
decir que hay muchas rectas que pasan por un punto y no cortan a 
otra recta dada dentro de una distancia finita dada, por grande que 
sea. Dado que la máxima longitud posible de una regla real, de un 
hilo, o incluso de un. rayo de luz visible con un telescopio es cierta- 
mente finita, y puesto que dentro de cualquier círculo finito hay infi- 
nitas rectas que pasan por un punto dado y que no cortan a otra recta 
dada interior al círculo, se deduce que este axioma no podrá ser verifi- 
cado por experimentación. Todos los otros axiomas de la geometría 
` euclidea tienen carácter finito en el sentido de que tratan con porciones 
finitas de rectas y con figuras planas de extensión finita. El hecho de 
que el axioma de las paralelas no sea verificable experimentalmente 
plantea la cuestión de ver si es o no independiente de los otros axiomas. 
Si fuera una consecuencia lógica necesaria de los otros, sería posible 
eliminarlo como axioma y dar una demostración del mismo mediante 
los otros axiomas de Euclides. Durante varios siglos, los matemáticos 
trataron de hallar esa demostración, porque existía el sentimiento 
general de que el postulado de las paralelas era de carácter esencial- 
mente diferente de los demás, al faltarle ese carácter de evidente 
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plausibilidad que debería poseer todo axioma de la geometría. Uno de 
los primeros intentos de esta naturaleza fué hecho por Proclo (siglo 1v 
a. de J.C.), un comentador de Euclides, quien trató de descartar-la 
necesidad de un postulado especial, relativo a las rectas paralelas, 
definiendo la recta paralela a otra como el lugar de los puntos que se 
encuentran a una distancia fija de la dada. Proclo no vió que la difi- 
cultad se habia desplazado a. otro lugar, porque sería ahora necesario 
demostrar que el lugar de tales puntos es en efecto una recta. Como 
Proclo no pudo probar esto, debió de aceptarlo como postulado en 
lugar del axioma de las paralelas, y nada se ganó con ello, pues no es 
difícil demostrar que ambos son equivalentes. El jesuíta Saccheri (1667- 
1733), y más tarde Lambert (1728-1777), trataron de probar el postu- 
lado de las paralelas por el método indirecto de admitir lo contrario 
y deducir consecuencias absurdas. Lejos de ser absurdas, sus con- 
clusiones realmente equivalían a tecremas de la geometría no euclídea 
desarrollada después. Si hubieran considerado tales conclusiones, no 
como absurdas, sino más bien como enunciados compatibles en sí mis- 
mos, habrían sido los descubridores de la geometría no euclídea. . 

En aquel tiempo, todo sistema geométrico que no estuviera en ab- 
soluto acuerdo con el de Euclides debía considerarse como un evidente 
desatino. Kant, el filósofo que mayor influjo ejerció en dicho período, 
formuló esa actitud en la afirmación de que los axiomas euclídeos son 
inherentes a la mente humana, y, por tanto, tienen una validez obje- 
tiva para el espacio «real». Esta creencia en los axiomas de la geome- 
“tría euclídea como verdades inalterables, existentes en el reino de la 
intuición pura, fué uno de los dogmas básicos de la filosofía kantiana. 
Pero a la larga, ni viejos hábitos del pensamiento ni la autoridad filo- 
sófica podían reprimir la convicción de que la interminable serie de 
fracasos en la búsqueda de una demostración del postulado de las pa- 
ralelas no era debida a una falta de ingenio, sino más bien al hecho de 
que tal postulado es realmente independiente de los otros. (Análoga- 
mente, el fracaso en la resolución de la ecuación general de quinto 
grado por medio de radicales llevó a la sospecha, más tarde verificada, 
de que tal solución es imposible.) El húngaro Bolyai (1802-1860) y el 
ruso Lobachevsky (1793-1856) resolvieron la cuestión construyendo 
con todo detalle una geometría en la cual el postulado de las paralelas 
no se verifica. Cuando el joven y entusiasta genio Bolyai sometió su 
memoria a Gauss, «príncipe de los matemáticos», para el reconoci- 
miento tan ansiosamente esperado, fué informado de que Gauss mismo 
se le había anticipado, pero no había querido publicar sus resultados 
por temor a una ruidosa publicidad. 
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¿Qué significa la independencia del postulado de las paralelas? 
Sencillamente, que es posible construir un sistema compatible de pro- 
posiciones «geométricas» referentes a puntos, rectas, etc., deduciéndo- 
las de un conjunto de axiomas en el cual el postulado de las paralelas 
.se haya reemplazado por un postulado contrario. Tal sistema se llama 
una geometría no euclídea. Fué precisa la fuerza intelectual de Gauss, 
Bolyai y Lobachevsky para darse cuenta de que tal geometría, ba- 
sada en un sistema de axiomas no euclidiano, podía ser perfectamente 
compatible. : 

Para: probar la compatibilidad de la nueva geometria no basta 
-<únstruir:un. vasto cuerpo de teoremas no euclidianos, como hicieron 
Bolyai y Labechevsky. En lugar de ello, hemos aprendido a construir 
«modelos»:de tal geometría que satisfacén todos los axiomas de Eucli- 
des, excepto el de las paralelas. El más sencillo de dichos modelos fué 
dado por Félix Klein, cuyo trabajo en este campo fué estimulado por 
las ideas del geómetra inglés Cayley (1821-1895). En este modelo 
pueden: trazarse infinitas rectas paralelas a una recta dada por un 
punto exterior; tal geometría es llamada geometría Bolyai-Lobachevsky 
e hiperbólica. (La razón de este último nombre se encontrará en la 
pág. 238.) 

El modelo de Klein se construye considerando primero objetos de 
la geometría euclídea ordinaria y bautizando a algunos de estos objetos 
y a las relaciones entre ellos de tal modo que resulte una geometría 
no euclidea. Este modelo debe ser, eo ipso, tan carente de contradic- 
ción como el sistema euclídeo original, pues se nos ofrece, visto desde 
otro punto y descrito con otras palabras, igual que el sistema de pro- 
posiciones de la geometría euclidea ordinaria. Dicho modelo puede ser 
fácilmente comprendido por medio de algunos conceptos de geome- 
tría proyectiva. 

Si sometemos el plano a una transformación proyectiva sobre otro 
plano, o mejor sobre sí mismo (por posterior coincidencia del punto 
imagen con el plano original), en general, un círculo y su interior se 
transformarán en una cónica. Pero es fácil ver (omitimos la demostra- 
ción) que existen infinitas transformaciones proyectivas del plano en 
sí mismo tales que un círculo dado y su interior se transformen en sí 
mismos. Por tales transformaciones, puntos del interior o del contorno 
son en general llevados a otras posiciones, pero quedan interiores o en 
el contorno del círculo (p. ej., podemos transformar el centro del 
círculo en cualquier otro punto interior). Consideremos la totalidad 
de tales transformaciones. Ciertamente, éstas no dejarán invariantes 
las formas de las figuras, y por tanto no son desplazamientos rígidos 
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en el sentido usual; pero ahora damos el paso decisivo al llamar a dichas 
transformaciones «desplazamientos no euclídeos» de la geometría que 
estamos construyendo. Por medio de estos «desplazamientos» podemos 
definir la congruencia: dos figuras se dirán congruentes si existe un 
desplazamiento no euclídeo que transforme una en la otra. 

El modelo de Klein de la geometría hiperbólica es entonces el si- 
guiente: el «plano» consiste sólo en los puntos interiores a un círculo; 
los puntos exteriores no se consideran. Cada punto interior del círcu- 
lo se llama «punto» no euclídeo; cada cuerda del círculo se llama 
«recta» no ¿uclídea; los «desplazamientos» y «congruencias» se han de- 
finido anteriorménte; unir «puntos» y hallar la intersección de «rec- 





Fic. 110.—Modelo no euclídeo de Klein. FiG. 111.—Distancia no euclídea. 


tas» en el sentido no euclídeo sigue siendo lo mismo que en la geo- 
metría de Euclides. Es fácil probar que el nuevo sistema satisface 
todos los postulados de la geometría euclídea, con la sola excepción 
del de las paralelas. Que el postulado de las paralelas no se verifica 
en el nuevo sistema se ve por el hecho de que por todo «punto» exte- 
rior a una «recta» pueden trazarse infinitas «rectás» que no tengan 
ningún «punto» común con la «recta» dada. La primera «recta» es una. 
cuerda euclídea del círculo, mientras la segunda «recta» puede ser cual- 
quiera de las cuerdas que pasan por el «punto» dado y que no cortan 
a la primera «recta» dentro del círculo. Este sencillo modelo es por 
completo suficiente para decidir la cuestión fundamental que dió na- 
cimiento a la geometría no euclidea; demuestra que el postulado de las 
paralelas no puede ser deducido de los otros axiomas de la geometría 
euclídea; pues si pudiera deducirse, debería ser un teorema verdadero 
en la geometría del modelo de Klein, y hemos visto que no lo es. 


En términos estrictos, este razonamiento está basado en la hipótesis de que 
la geometría del modelo de Klein no es contradictoria, en el sentido de que no 
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pueden demostrarse a la vez un teorema y su contrario. Pero esta geometría está, 
efectivamente, tan desprovista de contradicción como la geometría euclidea ordi- 
naria, ya que las proposiciones referentes a puntos, rectas, etc., en el modelo de 
Klein, son meramente modos distintos de enunciar determinados teoremas de la 
geometría euclídea. No ha sido dada hasta ahora una demostración satisfactoria 
de la compatibilidad de los axiomas de la geometría euclídea, salvo por reducción 
a los conceptos de la geometría analítica y por ello, en última instancia, al continuo 
numérico, cuya carencia de contradicción es de nuevo una cuestión sin resolver. 


*Debemos mencionar aquí un detalle que excede a nuestro objetivo 
inmediato, esto es, la manera de definir la «distancia» no euclídea en 
el modelo de Klein. Esta «distancia» debe resultar invariante respecto 
e: cualquier «desplazamiento» no euclideo, pues éste no debe alterar 
las distancias. Sabemos que las razones dobles no: «varían en la proyec- 
ción, y una razón doble que haga intervenir dos puntos arbitrarios 
P y Q, interiores al círculo, aparece inmediatamente si se prolonga el 
segmento PQ hasta su intersección con la circunferericia en O y S. La 
razón doble (OSPQ) de estos cuatro puntos es un número (positivo) 
que puede tomarse como definición de «distancia» PQ entre P y Q, 
si bien debemos modificar ligeramente esta definición para hacerla 
útil. Pues si los tres res puntos P, Q, R están sobre una recta, debe verifi- 


carse que PO + OR = PR. Ahora bien: en general, 
(OSPQ) + (OSRQ) + (OSRP). 
Por el contrario, tenemos la relación 
(OS PQ) (OSRO) = (OSRP), 11] 
como resulta de las igualdades 


QO/JQS  RO/RS  RO/RS 
(OSQP) (OS RQ) = -POJ PS > ojos = “Pojes = (OSRP). 


Como consecuencia de la ecuación [1] podemos dar una definición 
aditiva satisfactoria midiendo la «distancia», no por la razón doble, 
sino por el logaritmo de la razón doble: 


PQ = distancia no euclidea de P a Q = log (OSQP). 


Esta distancia será un número positivo, ya que (OSQP) > 1 si P 4Q. 
Utilizando la propiedad fundamental del logaritmo (véase Cap. VII) 
resulta de [1] que PQ + QR = PR. Es indiferente la base que se elija 
para el sistema de logaritmos, pues al variar ésta, solamente cambia 
la unidad de medida. Observemos que si uno de los puntos, p. ej., Q, 
se aproxima a la circunferencia, la distancia no euclídea PQ tiende a 
infinito, lo cual prueba que la recta de nuestra geometría no euclídea 
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tiene longitud no euclídea infinita, aunque en el sentido euclideo ordi- 
nario sea solamente un segmento finito de recta. 

3. Geometría y realidad.—El modelo de Klein demuestra que la 
geometría hiperbólica, considerada como un sistema formal deductivo, 
resulta tan satisfactoria como la geometría euclidea clásica. La cues- 
tión que se presenta es: ¿cuál de las dos es preferible como descrip- 
ción de la geometría del mundo físico? Como ya hemos visto, la expe- 
rimentación nunca podrá decidir si hay una sola paralela o bien hay 
infinitas por un punto exterior a una recta dada. En la geometría 
euclídea, sin embargo, la suma de los ángulos de cualquier triángulo 
es 180°. A este respecto, Gauss ideó un experimento para resolver la 
cuestión. Midió con todo cuidado los ángulos de un triángulo formado 
por tres cimas montañosas muy distantes, y encontró que la suma era 
de 1800, dentro de los límites del error experimental. Si el resultado 
hubiera sido notablemente inferior a 1809, la consecuencia inmediata 
sería que la geometría hiperbólica es preferible para describir la reali- 
dad física. Pero nada se resolvió con este-experimento, ya que para 
pequeños triángulos, cuyos lados tienen sólo unos pocos kilómetros de - 
longitud, la diferencia con 1800 en la geometría hiperbólica debe ser 
tan pequeña como para pasar inadvertida con los instrumentos usa- 
dos por Gauss. Así, a pesar de que el experimento no resolvió la cues- 
tión, probó, no obstante, que las geometrías hiperbólica y euclídea, 
cuyas diferencias en grande son notables, coinciden casi por completo 
para figuras relativamente pequeñas, por lo que experimentalmente 
son equivalentes. Por tanto, mientras se consideren propiedades pura- 
mente locales del espacio, la. elección entre ambas geometrías debe ha- 
cerse sólo sobre la base de la sencillez y comodidad. Puesto que el 
sistema euclídeo es más sencillo de manejar, está justificado que lo 
usemos exclusivamente, por lo menos mientras se consideran distan- 
cias pequeñas (¡de unos cuantos millones de kilómetros!). Pero no de- 
bemos esperar necesariamente que dicho sistema sea apropiado para 
describir el universo como un todo, en sus aspectos más grandiosos. 
Aquí la situación es precisamente análoga a la que existe en física, 
donde los sistemas de Newton y de Einstein dan los mismos resulta- 
dos para pequeñas distancias y velocidades, pero divergen cuando se 
trata de grandes magnitudes. 

La importancia revolucionaria del descubrimiento de la geometría 
no euclídea estriba en el hecho de que destruyó la noción que se tenía 
de los axiomas de Euclides, como esquema matemático inmutable 
al que debía adaptarse nuestro conocimiento experimental de la 
realidad física. 
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4. Modelo de Poincaré.—El matemático es libre de considerar una 
«geometría» como definida por cualquier sistema de axiomas compa- 
tibles, referentes a puntos, rectas, etc.; sus investigaciones resultarán 
útiles al fisico únicamente cuando estos axiomas se ajusten al com- 
portamiento físico de los objetos del mundo real. Desde este punto 
de vista, vamos a examinar el significado de la frase «la luz se propaga 
en línea recta». Si se considera esto como definición física de «recta», 
entonces los axiomas de la geometría deben ser elegidos de forma que 
se correspondan con el comportamiento de los rayos de luz. Imagine- 
mos, cor Poincaré, un universo constituído por el interior de una 
circunferencia C y tal que la velocidad de la luz en un punto del círculo 
sea igual a la distancia del mismo. a la circunferencia. Puede demos- 
trarse:que los rayos de luz adoptarán la forma de arcos circulares, 
nórmales:en sus extremos a la circunferencia C. En tal universo, las 

propiedades geométricas de 
las «rectas» (definidas como 
rayos de luz) diferirán de 
las propiedades euclídeas 
de las rectas, y, en particu- 
lar, el postulado de las pa- 
ralelas dejará de cumplirse, 
puesto que existen infinitas 
«rectas» que pasan por un 
punto y no cortan a una 
«recta» dada. Por supuesto, 
que los «puntos» y «rectas» 
de este universo tendrían 
exactamente las propieda- 
des geométricas de los «pun- 
tos» y «rectas» del modelo 

Fic. 112,—Modelo no euclideo de Poincaré. de Klein. En otras palabras: 

tendríamos un modelo dife- 
rente de la geometfía hiperbólica. Pero la geometría euclidea se apli- 
cará también a este universo; en lugar de ser «rectas» no euclídeas, 
los rayos luminosos serían circunferencias euclídeas ortogonales a C. 
Vemos así que diferentes sistemas de geometría pueden describir la 
misma situación física, con tal que los objetos físicos (en este caso, 
rayos de luz) estén correlacionados con los diferentes conceptos de los 
dos sistemas: 


rayo de luz—> «línea recta» — geometría hiperbólica. 
rayo de luz —> «circunferencia» — geometría euclidea. 
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Puesto que el concepto de recta en la geometría euclidea corres- 
ponde a la conducta de un rayo de luz en un medio homogéneo, dire- 
mos que la geometria de la región interior a C es hiperbólica, para 
significar sólo que las propiedades físicas de los rayos luminosos en 
ese universo corresponden a las propiedades de las «rectas» de la 
geometría hiperbólica. 

5. Geometría elíptica o de Riemann.—En la geometría de Euclides, 
así como en la hiperbólica de Bolyai y Lobachevsky, se supone táci- 
tamente que la recta es infinita (la extensión infinita de la recta está 
esencialmente vinculada con el concepto y los axiomas de «estar entre»). 
Pero después que la geometría hiperbólica hubo abierto el camino 
hacia la libre construcción de geometrías, era natural preguntar si 
podía construirse una geometría 
no euclídea en la cual una línea 
recta no fuera infinita, sino fi- 
nita y cerrada. Por supuesto, en 
tales geometrías no sólo debería 
abandonarse el postulado de las 
paralelas, sino también los axio- 
mas referentes a «estar entre». 

Los desarrollos modernos han 

probado la importancia física 

de estas geometrías. Fueron con- 

sideradas por primera vez en el 

discurso inaugural pronunciado 

en 1851 por Riemann con mo- 

tivo de su admisión como profe- Fis. 113.—+Líncas rectas» en la geometría 
sor adjunto («Privat-Docent») en 

la Universidad de Gotinga. Pueden construirse geometrías con rectas 
finitas y cerradas en una forma carente por completo de contradicción. 

Imaginemos un mundo bidimensional, consistente en lá superficie 
S de una esfera, en el cual definimos la recta con el significado de 
círculo máximo de la esfera. Éste sería el camino natural para descri- 
bir el mundo de un navegante, puesto que los arcos de círculo máximo 
son las curvas de longitud mínima entre dos puntos de una superficie 
esférica, y ésta es la propiedad característica de las rectas del plano. 
En tal mundo, dos «rectas» cualesquiera se cortan, de modo que por 
un punto exterior a una recta no puede trazarse ninguna paralela 
(esto es, no secante) a la «recta» dada. -La geometría de las «rectas» 
en dicho mundo se llama geometría elíptica. En esta geometría, la 
distancia entre dos puntos se mide simplemente por su distancia a 
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lo largo del menor arco del círculo máximo que los une, mientras los 
ángulos se miden como en la geometría euclídea. Consideramos en 
general como típico de una geometría elíptica el hecho de que no exista 
ninguna paralela a una recta dada. 

Siguiendo a Riemann, podemos generalizar dicha geometría como 
sigue. Consideremos un universo consistente en una superficie curva 
en el espacio, no necesariamente esférica, y definamos la «recta» que 





Fic, 114.—Punto elíptico. 


une dos puntos como la curva de menor longitud o «geodésica» que une 
esos puntos. Los puntos de la superficie pueden dividirse en dos cla- 
ses: 1) puntos tales que en un entorno de cada uno la superficie es 
como una esfera, en el sentido de que está situada por completo de 
un mismo lado del plano tangente en ese punto; 2) puntos tales que 
en un entorno de cada uno la superficie tiene forma de silla de montar 
-y está situada a ambos lados del plano tangente en el punto. Los 
puntos de la primera clase se llaman puntos elípticos de la superficie, 
puesto que si el plano tangente se traslada un poco paralelamente a 
sí mismo, corta a la superficie en una curva elíptica; mientras que los 
puntos de la segunda clase se llaman hiperbólicos, ya que, si el plano 
tangente se traslada un poco paralelamente a sí mismo, corta a la 
superficie en una curva parecida a una hipérbola. La geometría de las 
«rectas» geodésicas en el entorno de un punto de una superficie es 
elíptica o hiperbólica según que el punto sea elíptico o hiperbólico. 
En tal modelo de geometría no euclídea, los ángulos se miden por su 
valor euclídeo ordinario. 
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Esta idea fué desarrollada por Riemann, quien consideró una geo- 
metría del espacio análoga a esta geometría de una superficie, en la 
cual la «curvatura» del espacio puede cambiar el carácter de la geo- 
metría de un punto a otro. Las rectas en una geometría de Riemann 
son las geodésicas. En la teoría general de la relatividad de Einstein, 
la geometría del espacio es una geometría de Riemann; la luz se pro- 
paga a lo largo de geodésicas, y la curvatura del espacio se determina 
por la naturaleza de la materia que lo llena. 

Desde su origen en el estudio de la axiomática, la geometría no 
euclídea se ha ido desarrollando hasta convertirse en un instrumento 
útil para su aplicación al mundo físico. En la teoría de la relatividad, 
en óptica, y en la teoría general de la propagación de ondas, una des- 





FIG. 115.-—Punto hiperbólico. 


cripción no euclidea de los fenómenos es a veces mucho más adecuada 
que la descripción clásica. 


APÉNDICE 


*GEOMETRÍA DE MÁS DE TRES DIMENSIONES 


1. Introducción.—El espacio real, que es el medio donde tiene 
lugar nuestra experiencia física, tiene tres dimensiones; el plano, dos, 
y la recta, una. Nuestra intuición espacial, en un sentido ordinario, 
está definitivamente limitada a tres dimensiones. Sin embargo, en 
muchas ocasiones es conveniente hablar de espacios de cuatro o más 
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dimensiones. ¿Cuál es el significado de un espacio n-dimensional cuan- 
do n es mayor que tres, y para qué fines puede servir? Puede darse 
una respuesta tanto desde el punto de vista analítico como desde el 
puramente geométrico. La terminología de un espacio n-dimensional 
puede considerarse meramente como un lenguaje geométrico sugestivo 
para ideas matemáticas que no están ya al alcance de la intuición 
geométrica ordinaria. Daremos una breve indicación de las sencillas 
consideraciones que motivan y justifican este lenguaje. 

2. Método analítico.—Hemos insistido ya en la inversión de sig- 
nificado que tuvo lugar en el curso del desarrollo de la geometría ana- 
lítica. Puntos, rectas, curvas, etc., eran originariamente considerados 
como entes puramente geométricos, y el objeto de la geometría anali- 
tica era sólo el de asignarles sistemas de números o ecuaciones, e 
interpretar o desarrollar una teoría geométrica por métodos algebrai- 
cos o analíticos. En el transcurso del tiempo, el punto de vista opuesto 
comenzó a imponerse cada vez más. Un número z o un par de números 
zx, y o una terna de números x, y, z, fueron considerados como los 
objetos fundamentales, y estas entidades analíticas fueron luego «inter- 
pretadas» como puntos de una recta, de un plano, o del espacio. Desde 
este punto de vista, el lenguaje geométrico sirve únicamente para 
establecer relaciones entre números. Podemos descartar el carácter 
primario o incluso independiente de los objetos geométricos, diciendo 
que un par de números x, y es un punto del plano, que el conjunto de 
todos los pares de números x, y que satisfacen a la ecuación lineal 
L (x, y) = ax + by + c = 0 de coeficientes fijos a, b, c, es una rec- 
ta, etc. Definiciones análogas pueden darse para el espacio de tres 
dimensiones. 

.Aun estando, primordialmente -interesados .en un problema alge- 
braico puede ocurrir que el lenguaje geométrico proporcione una des- 
cripción breve y adecuada del mismo, y que la intuición geométrica 
sugiera el procedimiento algebraico apropiado; p. ej., si deseamos resol- 
ver un sistema de tres ecuaciones lineales con tres incógnitas zx, y, 2: 


L(x, y, 2) = ar + by + cz +d 
Lx, y, z) =ax +by +z +d 


0 
0 
Lx, y, z) = a"z + by + cz 4 d” 0, 


podemos interpretar el problema como si se tratara de hallar el punto 
de intersección en el espacio tridimensional Rs de tres planos defini- 
dos por las ecuaciones L = 0, L’ = 0, L” = 0. También, si estamos 
sólo considerando los pares de números x, y para los cuales x > 0, 
podemos interpretarlos como representando el semiplano de la dere- 
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cha del eje x. Con mayor generalidad, la totalidad de los pares de 
números v, y para los cuales 


L(x, y) =ar+by+d>0 


puede interpretarse como el semiplano a un lado de la recta L = 0, 
y la totalidad de las ternas de números x, y, z para las cuales 


L(x, y, z) =ar+by+e2+4d>0 


puede considerarse como el «semiespacio» de un lado del plano 
L(x, y, 2) = 0. 

La introduccióm de un «espacio tetradimensional», o incluso de un 
«espacio n-dimensional», resulta ahora natural. Consideremos una cua- 
terna de números z7, y, z, t; se dice que tal cuaterna está representada 
por, o simplemente es, un punto del espacio tetradimensional R4. Con 
más generalidad, un punto del espacio n-dimensional Rh es, por defi- 
nición, un conjunto ordenado de n números reales 21, Te, ..., Xn. No 
importa que no podamos idearnos tal punto. El lenguaje geométrico 
es igualmente sugestivo para las propiedades algébricas referentes a 
cuatro o n variables. La razón de esto es que muchas de las propieda- 
dades algébricas de las ecuaciones lineales, etc., son esencialmente in- 
dependientes del número de variables que aparecen o, como podemos 
decir, de la dimensión del espacio de las variables; p. ej., llamamos 
«hiperplano» a la totalidad de los puntos zi, £2, ..., Tn de un espacio 
n-dimensional Rn y que satisfacen a la ecuación lineal: 


L(%1, T3, * *' , Tn) = 01%1 + 4 + "+ Anta + b=0. 


Por tanto, el problema algebraico fundamental de resolver un sis- 
tema de n ecuaciones lineales con n incógnitas: 


Li(%1, 22, * **,En) =0 
Laltıi, £3, °°, £n) =0 
Lníz,, Ts)", Tn) = 0, 


se plantea en lenguaje geométrico como el de determinar el punto de 
intersección de los n hiperplanos Lı = 0, Lz = 0, ..., Ln = 0. 

La ventaja de este modo geométrico de expresión radica solamente en 
que hace hincapié sobre ciertas propiedades algebraicas que son indepen- 
dientes de n, y que pueden imaginarse intuitivamente para n < 3. En 
muchas aplicaciones, el uso de tal terminología tiene la ventaja de 
abreviar, facilitar y dirigir las consideraciones intrinsecamente anali- 
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ticas. La teoría de la relatividad puede mencionarse como ejemplo 
donde se ha logrado un importante progreso unificando las coorde- 
nadas espaciales x, y, z y la coordenada de tiempo t, en un «suceso» 
perteneciente a una variedad tetradimensional «espacio-tiempo» de 
cuaternas de números zx, y, Z, t. Por la introducción de una geometría 
no euclídea hiperbólica en este esquema analítico se hace posible des- 
cribir con gran sencillez muchas situaciones de otro modo complejas. 
Ventajas análogas se han obtenido en mecánica y en física estadís- 
tica, así como en campos puramente matemáticos. 

He aquí algunos ejemplos tomados de las matemáticas. La tota- 
lidad de los círculos del plano constituye una variedad tridimensio- 
nal, porque un círculo de centro x, y, y radio t puede ser representado 
por un punto de coordenadas zx, y, t. Puesto que el radio de un círculo 
es un número positivo, la totalidad de los puntos representativos de 
circulos llena un semiespacio. De la misma manera, el conjunto de 
todas las esferas del espacio tridimensional ordinario constituye una 
variedad tetradimensional, ya que cada esfera de centro z, y, z y 
radio f puede representarse por un punto de coordenadas x, y, z, t. 
Un cubo en el espacio tridimensional, de arista 2, caras paralelas a 
los planos coordenados y centro en el origen, está formado por la 
totalidad de los puntos 21, £2, za para los cuales | z; | <1, | z2 | <1, 
| r3 | <1. De la misma manera, un «cubo» de arista 2 en un espacio 
n-dimensional Ry, caras paralelas a los planos coordenados y centro 
en el origen, se define como la totalidad de los puntos z1, T2, ..., Tn 
para los cuales se verifica simultáneamente 


zj <i, Iza <1,>':, |n] <1. 


La «superficie» de este cubo consta de todos los puntos para los 
que se verifica uno al menos de los signos de igualdad. Los elementos 
de superficie de dimensión n — 2 constan de los puntos para los cua- 
les tienen lugar dos al menos de los signos de igualdad, etc. 


Ejercicio: Descríbase la superficie de uno de tales cubos en el caso de tres, 
cuatro y n dimensiones. 


*3, Método geométrico o combinatorio.—Mientras la construcción 
analítica de la geometría n-dimensional es sencilla y se adapta bien 
a muchas aplicaciones, hay otro método de proceder que es de carác- 
ter puramente geométrico. Éste se basa en una reducción de los datos 
de na n — 1 dimensiones, lo que nos permitirá definir la geometría 
de varias dimensiones por un proceso de inducción matemática. 
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Comencemos con el contorno de un triángulo ABC en dos dimen- 
siones, Si se corta la poligonal cerrada por el punto C y se hacen girar 
AC y BC hasta que vengan sobre la recta AB, obtenemos el seg- 
mento de la figura 116, en el cual el punto C aparece dos veces. Esta 
figura unidimensional da una representación completa del contorno 
del triángulo de dos dimensiones. Plegando los dos segmentos AC y 
BC en el plano, podemos hacer que los dos puntos C coincidan de 
nuevo. Pero, y esto es el aspecto importante, no precisamos hacer tal 
plegado. Necesitamos solamente «identificar», o sea, no distinguir entre 
los dos puntos C de la figura 116, incluso aunque no coincidan efec- 
tivamente, como entes geométricos en sentido corriente. Podemos dar 


C 
A B 
aeee peo aa TEE iee a a e aA 
C A B Cc 


A B 
Que 

B C 
Q 

C A 


FIG, 116.—Triángulo definido por segmentos con los extremos coordinados. 


aún un paso más separando los tres segmentos por los puntos A y B, 
para obtener un conjunto de tres segmentos CA, AB y BC, que pue- 
den ser reunidos de nuevo para formar un triángulo «real» sin más que 
hacer coincidir los pares de puntos identificados, Esta idea de identi- 
ficar puntos diferentes en un conjunto de segmentos para formar un 
polígono (en este caso, un triángulo) resulta a veces muy práctica. Si 
deseamos embarcar una complicada estructura de acero, como la de 
un puente, la reducimos a simples barras y marcamos con el mismo 
símbolo aquellos extremos que deben ser unidos cuando la estructura 
vaya a ser armada en el espacio. El sistema de barras con extremos 
marcados es completamente equivalente a la estructura espacial. Esta 
observación sugiere el camino para reducir la superficie bidimensio- 
nal de un poliedro en un espacio de tres dimensiones a figuras de menor 
número de dimensiones. Tomemos, p. ej., la superficie de un cubo 
(Fig. 117); puede ser inmediatamente reducida a un sistema de seis 
cuadrados planos cuyos segmentos de contorno se identifiquen apro- 
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piadamente, y en otro paso ulterior se reduce a un sistema de doce seg- 
mentos rectilíneos con sus extremos convenientemente identificados. 

En general, cualquier poliedro del espacio tridimensional R puede 
reducirse de esta forma, bien a un sistema de polígonos planos, o bien 
a un sistema de segmentos rectilíneos. l 

Ejercicio: Efectúese esta reducción para todos los poliedros regulares (véase 
página 249). 

Queda ahora completamente claro que podemos invertir nuestro 
razonamiento, definiendo un poligono en el plano por un sistema de 
segmentos rectilíneos, y un poliedro en Rg por un sistema de poligo- 
nos en Rə, o bien, con una mayor reducción, por un sistema de seg- 
mentos rectilíneos. Por consiguiente, es natural definir un «poliedro» 
en el espacio de cuatro dimensiones Ra, mediante un sistema de po- 








0) 5 
2 7 
1 9 4 
Ak) 4 
JA) Y 


1 0 2 


E a 7 
4 Ome E 
SA) Y 
8 Omar) 7 
7 Omma 6 


96 


F1G. 117.—Cubo definido por coordinación de vértices y aristas. 


liedros en Rg con apropiada identificación de sus caras bidimensiona- 
les; los poliedros dé R5 por sistemas de poliedros en Ra, y así sucesi- 
vamente. En definitiva, podemos reducir cualquier poliedro en Rn a 
un sistema de segmentos rectilíneos. 

No es posible desarrollar aquí por completo esta teoría; sólo pue- 
den agregarse algunas observaciones sin demostración. Un cubo en Ra 
está limitado por 8 cubos de tres dimensiones, cada uno identificado 
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con un «vecino» a lo largo de una cara bidimensional. El cubo en R4 
tiene 16 vértices, en cada uno de los cuales se encuentran 4 de las 
32 aristas. En R4 hay 6 poliedros regulares; además del «cubo», hay 
uno limitado por 5 tetraedros regulares, uno limitado por 16 tetrae- 
dros, uno limitado por 24 octaedros, uno limitado por 120 dodecae- 
dros y otro limitado por 600 tetraedros. Para n > 4 dimensiones se 
ha demostrado que sólo son posibles tres poliedros regulares: uno con 
n + 1 vértices, limitado por n + 1 poliedros en Rp, con n aristas 


T 
as, 2) 
T 
rA T 
T 
Fic. 118.—Las figuras geométricas más sencillas en 1, 2, 3 y. 4 "dimensiones. 


de (n — 2) dimensiones; uno con 21 vértices, limitado por 2n poliedros 
en Rn, con 2n — 2 aristas, y uno con 2n vértices, limitado por 
2n poliedros, de n caras, en Rp... 


Ejercicio: Compárese la definición del cubo en Ra, dada en la página 242, con 
la definición que acabamos de dar ahora, y pruébese que la definición «analítica» 
de la superficie del cubo citado es equivalente a la definición «combinatoria» que 
se acaba de dar. 


Desde el punto de vista estructural, o «combinatorio», las figuras 
geométricas más sencillas de dimensiones 0, 1, 2, 3, son el punto, el 
segmento, el triángulo y el tetraedro, respectivamente. Con objeto de 
dar una notación uniforme designemos estas figuras con los símbolos 
To, Tı, Ta, Tg, respectivamente. (Los subíndices señalan la dimensión.) 

La estructura de cada una de estas figuras se describe diciendo que 
cada Ty contiene n + 1 vértices y que cada subconjunto de i + 1 vér- 
tices de un Tn(i = 0, 1, ..., n) determina un T;; p. ej., el tetraedro 
tridimensional Tg contiene 4 vértices, 6 segmentos y 4 triángulos. 

Es evidente la forma de proceder: Definimos un «tetraedro» tetra- 
dimensional T4 como un conjunto de 5 vértices tales que cada sub- 
conjunto de 4 vértices determina un Tg, cada subconjunto de 3 vér- 
tices determina un Tz, etc. El diagrama esquemático de T4 se muestra 
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en la figura 118. Vemos que T, contiene 5 vértices, 10 segmentos, 
10 triángulos y 5 tetraedros. 
La generalización para n dimensiones es inmediata. Por la teoría 


ri 


de las combinaciones se sabe que hay exactamente G = AA 


ir — ol 


subconjuntos diferentes, de i objetos cada uno, que pueden formarse 
con un conjunto dado de r objetos. Luego un «tetraedro» n-dimensio- 


nal contiene: 


n+l 


CG =n+1 
+n _(n+1)! 
C = 2n — 1)! 


o (n + 1) 
3 


3n — 2) 


on MEM 
4 


An — 3) 


vértices (To), 


segmentos (TD, 


triángulos (Tə), 


Ejercicio: Dibújese un diagrama de Ts y determínese el número de los Tı 
diferentes que contiene, para i = 0, 1, 2, 3, 4, 5. 


CAPÍTULO V 
TOPOLOGÍA 


Introducción. —A mediados del siglo xix comenzó un desarrollo 
enteramente nuevo de la geometría, que pronto se convirtió en una 
de las fuerzas más potentes de la matemática moderna. La nueva 
disciplina, llamada andlisis situs o topologia, estudia las propiedades 
de las figuras geométricas que subsisten aun si esas figuras se some- 
ten a deformaciones tan radicales que las hagan perder todas sus 
propiedades métricas y.proyectivas. 

Uno de los grandes geómetras de esa época fue A. F. Moebius 
(1790-1868), un hombre cuya falta de seguridad en sí mismo le llevó 
al puesto de insignificante astrónomo en un observatorio de impor- 
tancia secundaria de Alemania. A la edad de sesenta y ocho años 
sometió a la Academia de París una memoria sobre superficies de 
«una sola cara», que contenía algunos de los hechos más sorprendentes 
de este nuevo tipo de geometría. Al igual que otras importantes con- 
tribuciones anteriores, su trabajo permaneció sepultado varios años 
en los archivos de la Academia, hasta que por fin lo publicó su autor. 
Independientemente de Moebius, el astrónomo J. B. Listing (1808- 
1882), de Gotinga, hizo descubrimientos análogos, y a sugerencia de 
Gauss publicó en 1847 un pequeño libro, Vorstudien zur Topologie. 
Cuando Bernhard Riemann (1826-1866) llegó a Gotinga como estu- 
diante, encontró la atmósfera matemática de esa ciudad universita- 
ria llena de ansioso interés por estas nuevas y extrañas ideas geomé- 
tricas, Pronto se dió cuenta de que allí estaba la clave para compren- 
der las propiedades más profundas de las funciones analíticas de una 
variable compleja. Nada, quizá, ha dado más ímpetu al posterior des- 
arrollo de la topología que la formidable estructura de la teoría de 
funciones de Riemann, en la cual los conceptos topológicos son abso- 
lutamente fundamentales. 

Al principio, la novedad de los métodos en el reciente campo no 
dejó tiempo a los matemáticos para presentar sus resultados en la 
tradicional forma axiomática de la geometría elemental, En lugar de 
ello, los primeros investigadores, como Poincaré, se vieron forzados a 
confiar ampliamente en la intuición geométrica. Aún hoy, un estu- 
diante de topología encontrará que si exagera la insistencia en el 
rigor de la presentación puede perder de vista el contenido geomé- 
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trico esencial entre la masa de detalles formales. Sin embargo, es un 
gran mérito de los trabajos recientes el haber incluído la topología 
dentro del marco de la matemática rigurosa, donde la intuición sigue 
siendo la fuente, pero no la última razón de validez de la verdad. 
Durante este proceso, comenzado por L. E. J. Brouwer, la importan- 
cia de la topología para casi toda la matemática se ha ido incremen- 
tando, Matemáticos americanos, en particular O. Veblen, J. W. Alexan- 
der y S. Lefschetz, han aportado importantes contribuciones al tema. 

Aunque la topología es, en definitiva, una creación de los últimos 
cien años, hubo unos pocos descubrimientos aislados anteriores, que 
después encontraron su lugar en el moderno desarrollo sistemático. 
Sin duda, el más importante de ellos es una fórmula que relaciona el 
número de vértices, aristas y caras de un poliedro simple, observada 
ya en 1640 por Descartes, y redescubierta y utilizada por Euler 
en 1752. El típico carácter de esta relación como teorema topológico 
se hizo evidente mucho más tarde, después de que Poincaré reconoció 
«la fórmula de Euler» y sus generalizaciones como uno delos teoremas 
centrales de la topología. Así, por razones tanto históricas como in- 
trínsecas, iniciaremos nuestro estudio de la topología con la fórmula 
de Euler. Puesto que el ideal del rigor perfecto no es ni necesario ni 
deseable durante los primeros pasos en un campo no familiar, no 
dudaremos en apelar de cuando en cuando a la intuición geométrica 
del lector. 


I. FÓRMULA DE EULER PARA LOS POLIEDROS 


- Aunque el estudio de los poliedros ocupó un. lugar privilegiado en 
la geometría griega, cupo a Descartes y a Euler el descubrimiento del 
siguiente hecho: en un poliedro simple, si se designa por V el número de 
vértices, por A el de aristas y por € el número de caras, se verifica 


V-A+C=2. 11] 


Por poliedro se entiende un sólido cuya superficie consta de un 
cierto número de caras poligonales. En el caso de los poliedros regu- 
lares todos los polígonos son congruentes y todos los ángulos en los 
vértices son iguales. Un poliedro es simple si no hay en él «agujeros»; 
o sea, si su superficie puede ser deformada con continuidad hasta 
transformarse en la superficie de una esfera. La figura 120 muestra 
un poliedro simple no regular, mientras la figura 121 representa un 
poliedro que no es simple, 

El lector puede comprobar el hecho de que la fórmula de Euler 
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se cumple para los poliedros simples de las figuras 119 y 120, pero 
no para el poliedro de la figura 121. 

Para demostrar la fórmula de Euler, imaginemos que el poliedro 
simple dado es hueco y su superficie de caucho. Si separamos una 
de las caras, podremos deformar la superficie restante hasta exten- 
derla sobre un plano. Por supuesto que las áreas de las caras y sus án- 


Fig. 119.—Los poliedros regulares. 
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ISS 


Fie. 120,—Polledro simple. V — A + C = 9 — 18 + 11 = 2. 








Fx 121.—Poliedro no simple. V — A + C = 16 — 32 + 16 = 0. 
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gulos se alterarán en este proceso, pero la red plana de vértices y 
aristas contendrá el mismo número de unos y otros que el poliedro 
original, en tanto que el número de polígonos es inferior en uno al 
del primitivo poliedro del cual hemos suprimido una cara. Vamos a 
probar que para la red plana obtenida V — A + C = 1, de forma 
que si se tiene en cuenta la cara suprimida resulta V — A + C = 2, 
para el poliedro dado. 

Comencemos por triangular la red plana del siguiente modo: En 
cualquier polígono de la red que no sea triángulo trazamos una dia- 
gonal, la cual incrementa ambos números A y C en 1, de forma que 








FIG, 122. -—- Demostración de la fórmula de Euler. 


el valor de V — A + C se conserva. Continuamos el trazado de dia- 
gonales que unen pares de puntos (Fig. 122) hasta que la figura 
consta sólo de triángulos, lo que puede ocurrir ya desde un principio. 
En la red triangulada, V — A + C conserva el mismo valor que tenía 
antes de la triangulación, puesto que el trazado de diagonales no lo 
ha alterado. Algunos de los triángulos tienen sus lados en la frontera 
de la red plana, y de éstos, algunos—tal como el ABC—tienen sólo 
un lado formando parte de dicha frontera, mientras que otros pueden 
tener dos. Elegimos uno de estos triángulos frontera y suprimimos 
los lados que no sean comunes con algún otro triángulo; así, del ABC 
quitamos el lado AC y descontamos la cara correspondiente, pero 
conservamos los vértices A, B, C y los otros dos lados AB y BC, en 
tanto que del triángulo DEF suprimimos la cara, los dos lados DF 
y FE y el vértice F. La supresión de un triángulo del tipo ABC dis- 
minuye los números A y C en 1, mientras V queda invariable, de 
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forma que V — A + C permanece inalterada. La supresión de un 
triángulo del tipo DEF hace disminuir V en 1, A en 2 y C en 1, de 
manera que V — A + C continúa invariable. Mediante una adecuada 
elección de la sucesión de estas operaciones podemos ir separando 
triángulos que tengan algún lado en la frontera (la cual varía, por 
supuesto, con cada supresión), hasta dejar finalmente un solo triángu- 
lo, con tres vértices, tres lados y una cara. Para esta red simplificada 
V-A+C=3-3+1=1, y como hemos visto que el proceso 
no alteraba el valor de V — A + C, también en la red plana inicial 
será V—-A+C=1, y lo mismo para el poliedro del que habíamos 
suprimido una cara. En conclusión, en el poliedro inicial completo 
V — A + C = 2, con lo cual queda demostrada la fórmula de Euler 
(véanse los problemas 56 y 57 del Apéndice). 


Basándonos en la fórmula de Euler es fácil demostrar que no existen más que 
cinco poliedros regulares. Supongamos, en efecto, que un poliedro regular tiene C 
caras, siendo cada una un polígono regular de n lados, y que en' cada vértice con- 
curren r aristas. Si contamos las aristas por el número de caras o el de vértices, 
se tiene i 


nC = 24, [2] 


pues cada arista es común a dos caras y está por ello contada dos veces en el pro- 
ducto nC; además, 


rV = 2A, 13) 


ya que cada arista tiene dos vértices. De [1], obtenemos la ecuación 





24 24 
— + — A m2, 
n r 
o bien 
1 1 1 1 4 
ntr | 14) 


Debemos comenzar con n >3 y r > 3, ya que un polígono tiene al menos tres 
lados, y por lo menos tres aristas concurren en cada vértice del poliedro. Pero 
n y r no pueden ser mayores que 3, pues el primer miembro de la ecuación [4] no 
excedería a 1/3, lo que es imposible, ya que A es entero positivo. Por tanto, vea- 
mos qué valores puede tener r para n = 3 y cuáles son los de n para r = 3, La 
totalidad de los poliedros obtenidos en estos dos casos nos da el número de polie- 
dros regulares posibles. 
Para n = 3, la ecuación [4] se transforma en 


1 1 1 

E A 
de donde r puede ser igual a 3, 4 ó 5 (6 ó un número mayor queda excluido, pues 
1/A es siempre positivo). Para estos valores de n y r hallamos A = 6, 12. ó 30, 
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que corresponden, respectivamente, al tetraedro, octaedro e icosaedro. Análoga- 
mente, para r = 3 se obtiene la ecuación 


de la cual resulta que n = 3, 4 ó 5, y A = 6, 12 ó 30, respectivamente. Estos va- 
lores corresponden al tetraedro, cubo y dodecaedro. Si sustituímos estos valores 
de n, r y A en las ecuaciones [2] y [3], obtenemos los números de vértices y caras 
de los respectivos poliedros. 


I. PROPIEDADES TOPOLÓGICAS DE LAS FIGURAS 


1. Propiedades topológicas.—Hemos visto que la fórmula de Euler 
se verifica para todo poliedro simple, pero la validez de esta fórmula 
no queda restringida, ni mucho menos, a los poliedros de la geome- 
tría elemental, de caras planas y aristas rectas; la demostración que 
acabamos de dar se aplicaría igualmente a poliedros simples de caras 
y aristas curvas, o a cualquier subdivisión de la. superficie de una 
esfera en regiones limitadas por arcos de curvas. Por otra parte, si 
imaginamos la superficie del poliedro o de la esfera constituída por 
una delgada lámina de:taucho, la fórmula de Euler todavía conserva 
su validez si la superficie se deforma doblando y estirando el caucho 
hasta darle otra cualquier forma, en tanto este proceso de deforma- 
ción no produzca desgarramiento. Esto se debe a que la fórmula se 
refiere sólo a los números de vértices, aristas y caras y no a longitudes, 
áreas, razones dobles o cualquier otro concepto ordinario de la geo- 
metría elemental o proyectiva. 

Recordemos que la geometría elemental tiene que ver con las mag- 
nitudes (longitud, ángulo y área) que quedan invariables en los movi- 
mientos rígidos, en tanto que la geometría proyectiva trata con con- 
ceptos (punto, recta, incidencia y razón doble) que quedan invaria- 
bles en el grupo más amplio de las transformaciones proyectivas. Pero 
los movimientos rígidos y las proyecciones son casos muy especiales 
de las llamadas transformaciones topológicas. Una transformación to- 
pológica de una figura geométrica A en otra A” está dada por cual- 
quier correspondencia 


p > p 


entre los puntos p de A y los p' de A”, caracterizada por las dos pro- 
piedades siguientes: 

1) La correspondencia es biunivoca. Esto significa que a cada pun- 
to p de A corresponde un solo punto p' de A”, y recíprocamente. 


COURANT, —10 
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2) La correspondencia es continua en ambos sentidos. Esto quiere 
decir que si tomamos dos puntos cualesquiera p, q de A y movemos 
p de forma que su distancia al punto q tienda a cero, la distancia entre 
los puntos correspondientes p’. q" de A” también tiende a cero, y 
recíprocamente. 

Toda propiedad de una figura geométrica A que también se cum- 
pla para cualquier figura en que A pueda transformarse por una 
transformación topológica, se llama una propiedad topológica de A, y 





Fic. 124.—Superficies no equivalentes topológicamente, 


topología es la rama de la geometría que se ocupa sólo de las propie- 
dades topológicas de las figuras. Imaginemos una figura copiada elibre- 
mente» por un consciente pero inexperto dibujante, que deforme las 
rectas en curvas y altere los ángulos, distancias y áreas; pues bien, 
aunque las propiedades métricas y proyectivas de la figura original se 
hayan perdido, sus propiedades topológicas permanecerán idénticas. 

Los ejemplos más intuitivos de transformaciones topológicas gene- 
rales son las deformaciones. Imaginemos una figura, como una super- 
ficie esférica o un triángulo, fabricada con una delgada lámina de 
caucho o dibujada sobre ella, la cual es luego estirada o retorcida de 
cualquier forma, sin rasgarla y sin hacer coincidir puntos distintos. 
(Hacer coincidir dos puntos distintos violaría la condición 1. Rasgar 
la lámina de caucho violaría la condición 2, puesto que dos puntos de 
la figura original que tienden a coincidir provenientes de lados opues- 
tos de la línea a lo largo de la cual se ha rasgado la lámina, no tende- 
rán a coincidir en la figura rasgada.) La posición final de la figura 
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debe ser, pues, una imagen topológica de la original. Un triángulo 
puede ser deformado hasta obtener otro triángulo, un círculo (figu- 
ras 123 y 124) o una elipse, y, por tanto, estas figuras tienen exacta- 
mente las mismas propiedades topológicas; pero no se puede defor- 
mar un círculo de manera que resulte un segmento rectilíneo, ni la 
superficie de una esfera puede dar lugar a la superficie interior de 
un tubo. 

El concepto general de transformación topológica es más amplio 
que el concepto de deformación. Por ejemplo, si una figura se rasga 
durante una deformación y seguidamente se unen los bordes del corte 
después de deformada, de igual manera que antes, el proceso define 
aún una transformación topológica de la figura original, aunque ya 
no es una deformación. Así las dos curvas de la figura 134 son topo- 
lógicamente equivalentes entre sí y lo son también a una circunfe- 
rencia, puesto que pueden cortarse, enderezarse, y luego unir ambos 
extremos. Pero es imposible deformar una curva en la otra o en una 
circunferencia, sin antes efectuar el corte de la curva. 

Las propiedades topológicas de las figuras (tales como la dada por 
el teorema de Euler y otras que serán discutidas en esta sección) 





a b 
FIG. 125. — Conexión simple y doble. 


tienen gran interés e importancia en muchas investigaciones mate- 
máticas. Son, en cierto sentido, las más profundas y fundamentales 
de todas las propiedades geométricas, puesto que persisten después 
de realizados los cambios de forma más radicales. 

2. Conexión.—Como nuevo ejemplo de dos figuras que no son 
topológicamente equivalentes, podemos considerar los dominios pla- 
nos de la figura 125. El primero de ellos consta de todos los puntos 
interiores a un círculo, mientras que el segundo lo constituyen todos 
los puntos situados entre dos.circunferencias concéntricas. Cualquier 
curva cerrada contenida en el dominio a puede deformarse o «con- 








Fic. 126.—Corte de un dominio doblemente 
conexo para lograr uno simplemente conexo. 
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traerse» continuamente alrededor 
de un único punto dentro del do- 
minio. Un dominio con esta pro- 
piedad se dice simplemente conexo. 
El dominio b no es simplemente 
conexo; p. ej., una circunferencia 
concéntrica con las dos circunfe- 
rencias que sirven de frontera no 
puede deformarse hasta reducirse 
a un único punto interior al do- 
minio, puesto que durante este 
proceso la curva debería pasar 
necesariamente por el centro de 
las circunferencias, que no es un 
punto del dominio. Un dominio 


que no es simplemente conexo se llama múltiplemente conexo. Si el 
dominio múltiplemente conexo b se corta a lo largo de un radio, 
como en la figura 126, el dominio resultante es simplemente conexo. 

Con mayor generalidad, podemos construir dominios con dos, tres, 





Fic. 127. —Reducción de un dominio triplemente conexo. 
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o más «agujeros», como el de la figura 127. Para convertir este domi- 
nio en otro simplemente conexo, son necesarios dos cortes. Si para 
convertir un dominio dado D múltiplemente conexo en otro simple- 
mente conexo se necesitan n — 1 cortes que no se atraviesen y que 
unan un borde con otro, entonces el dominio D se dice que tiene 
orden de conexión n. El orden de conexión de un dominio en el plano 
es un importante invariante topológico del dominio. 


HI. OTROS EJEMPLOS DE TEOREMAS TOPOLÓGICOS 


1. El teorema de la curva de Jordan.—Una curva cerrada y sim- 
ple (o sea, que no se corta a sí misma) está dibujada en el plano. ¿Qué 
propiedad de esta figura sub- 
siste cuando el plano se con- 
sidera como una lámina de 
caucho que puede deformar- 
se de cualquier modo? La 
longitud de la curva y el 
área que encierra pueden al- 
terarse con una deformación; 
pero hay una propiedad to- 
pológica de la configuración 
que es tan simple que puede 
parecer trivial: una curva sim- 
ple y cerrada C de un planó 
divide a éste en dos dominios, 
uno interior y otro exterior. 

Esto significa que los puntos 

del plano se dividen en dos F'® *28-—¿Qué puntos del plano son Interiores 
clases—A, el exterior de la 

curva, y B, el interior—, tales que cualquier par de puntos de la 
misma clase pueden unirse por medio de una curva que no corta a C, 
mientras que cualquier curva que una dos puntos pertenecientes a 
clases distintas debe cortar a C. Esta aserción es evidentemente cierta 
para una circunferencia o una elipse; pero esta evidencia disminuye 
notablemente si se considera una curva complicada tal como el in- 
trincado polígono de la figura 128. 

Este teorema fué establecido por primera vez por Camille Jordan 
(1838-1922), en su famoso Cours d'Analyse, en el cual toda una gene- 
ración de matemáticos aprendió el concepto moderno de rigor en aná- 
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lisis. Aunque parezca extraño, la demostración dada por Jordan no 
era ni corta ni sencilla, y la sorpresa resulta aún mayor si se advierte 
que dicha demostración era falsa y que se necesitó un considerable 
esfuerzo para llenar las lagunas de su razonamiento. La primera de- 
mostración rigurosa del teorema resultó muy complicada y difícil de 
entender, aun para muchos matemáticos bien entrenados. Sólo recien- 
temente se han dado demostraciones relativamente sencillas. Una ra- 
zón de la dificultad estriba en la generalidad del concepto de «curva 
simple cerrada», que no sólo incluye al conjunto de polígonos y cur- 
vas «uniformes», sino también a todas aquellas curvas, imágenes topo- 
lógicas de una circunferencia. Por otra parte, muchos conceptos como 
«interior», «exterior», etc., que son tan claros para la intuición, deben 
precisarse antes de poder dar una demostración rigurosa. Es de gran 
importancia teórica añalizar tales conceptos en su más amplia gene- 
ralidad, y gran parte de la topología moderna se consagra a este fin. 
Pero no debe olvidarse nunca que en la gran mayoría de los casos que 
se presentan en el estudio de los fenómenos geométricos concretos 
resulta innecesario manejar conceptos cuya excesiva generalidad cree 
dificultades adicionales. Así, p. ej., el teorema de la curva de Jordan 
puede demostrarse con relativa facilidad para curvas de «comporta- 
miento» razonable, como polígonos o curvas con tangente que varía 
con continuidad, que son las que aparecen en la mayoría de los pro- 
blemas importantes. Demostraremos el teorema para los poligonos en 
el apéndice de este capítulo. 
2. El problema de los cuatro colores.—A partir del ejemplo del 
teorema de la curva de Jordan, po- 
dría suponerse que la topología se 
ocupa de dar demostraciones riguro- 
sas de ciertas aserciones obvias, de las 
cuales ninguna persona en su sano 
juicio dudaría. Por el contrario, hay 
muchas cuestiones topológicas, algu- 
nas de ellas de forma muy simple, 
para las cuales la intuición no da res- 
puesta satisfactoria. Un ejemplo de 
este tipo es el famoso «problema de los 
cuatro colores». 
Fic. 129.— Iluminación de un mapa. Al iluminar un mapa geográfico, 

se acostumbra asignar diferentes colo- 
res a dos países cualesquiera que tienen una porción de frontera co- 
mún. Se ha encontrado empíricamente que cualquier mapa, indepen- 
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dientemente del número de países que contenga y de cómo estén éstos 
situados, puede iluminarse utilizando sólo cuatro colores diferentes. 
Es fácil ver que un número menor de colores no es suficiente para 
todos los casos. La figura 129 nos muestra una isla que, en efecto, no 
puede iluminarse con menos de cuatro colores, ya que pertenece a cua- 
tro naciones, cada una de las cuales tiene frontera con las otras 
tres. 

El hecho de que no se haya encontrado ningún mapa que requiera 
más de cuatro colores sugiere el siguiente teorema matemático: Para 

_cualquier subdivisión del plano en regiones que no se solapen, es siempre 
posible señalar las regiones con uno de los números 1, 2, 3,. 4, de tal 
modo que a dos regiones adyacentes no se les asigne nunca el mismo 
número. Por regiones «adyacentes» entendemos regiones còn todo un 
arco de frontera común: dos regiones que sólo tengan un punto o un - 
número finito de puntos comunes (como los estados de Colorado y 
Arizona) no se llamarán adyacentes, puesto que no puede surgir nin- 
guna confusión si se iluminan con el mismo color. 

El problema de demostrar este teorema parece haber sido pro- 
puesto primeramente por Moebius en 1840, después por DeMorgan 
en 1850, y de nuevo por Cayley en 1878. Kempe publicó una «demos- 
tración» en 1879; pero, en 1890, Heawood encontró un error en el 
razonamiento de Kempe. Mediante la revisión de la demostración de 
Kempe, Heawood pudo demostrar que cinco colores son siempre sufi- 
cientes. (Una demostración del teorema de los cinco colores se. da en 
el apéndice de este capítulo.) A pesar de los esfuerzos de muchos mate- 
máticos insignes, la cuestión sigue aún esencialmente estancada en este 
modesto resultado: se ha probado que cinco colores bastan para todos 
los mapas y se supone que cuatro colores son también suficientes. Pero, 
como en el caso del famoso teorema de Fermat (véase pág. 50), no se 
ha logrado ni una demostración de esta conjetura ni un contraejem- 
plo, por lo cual sigue siendo éste uno de los grandes problemas no 
resueltos de la matemática. El teorema de los cuatro colores fué real- 
mente demostrado para todos los mapas que contienen menos de 38 
regiones. En vista de este hecho, parece que incluso si el teorema 
general es falso, no podrá demostrarse esta falsedad mediante un 
ejemplo sencillo. 

En el problema de los cuatro colores los mapas pueden dibujarse, 
bien en el plano o sobre la superficie de una esfera. Los dos casos son 
equivalentes; todo mapa sobre la esfera puede representarse sobre e! 
plano haciendo un pequeño agujero interior a una de las regiones A 
y deformando la superficie resultante hasta hacerla plana, como en 
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la demostración del teorema de Euler. El mapa resultante en el plano, 
puede ser el de una «isla» constituida por las regiones restantes, ro- 
deada por «mar», que es la región A. Recíprocamente, invirtiendo este 
proceso, cualquier mapa plano puede representarse sobre una esfera. 
Podemos, por tanto, limitarnos a los mapas sobre la esfera. Además, 
dado que las deformaciones de las regiones y de sus fronteras no 
afectan al problema, podemos suponer que la frontera de cada región 
es un polígono simple cerrado, formado por arcos circulares, Aun así 
«regularizado», el problema permanece sin resolver; las dificultades en 
este caso, por oposición a las inherentes al teorema de la curva de 
Jordan, no residen en la generalidad de los conceptos de región y 
curva, 

Un hecho notable, relativo al problema de los cuatro colores, es el 
de que para superficies más complicadas que el plano y la esfera, los 
teoremas correspondientes han sido efectivamente demostrados, o sea 
que, por paradójico que parezca, el análisis de superficies geométricas 
más complicadas aparece a este respecto más fácil que el de los casos 
más sencillos, Por ejemplo, sobre la superficie de un toro (véase figu- 
ra 123), cuya forma es la de un buñuelo o de un neumático hinchado, 
se ha demostrado que cualquier mapa puede iluminarse utilizando 
siete colores, mientras pueden construirse mapas que contienen siete 
regiones, cada una de las cuales es fronteriza a las otras seis. 


*3. El concepto de dimensión. — El concepto de dimensión no presenta gran- 
des dificultades mientras se trata de figuras geométricas sencillas, tales como pun- 
tos, rectas, triángulos y polle- 

Á ros, Un punto único o un con- 
junto finito de puntos tiene di- 

mensión cero; un segmento recti- 

A e e líneo es unidimensional, y la 
superficie de un triángulo o la de 

una esfera son bidimensionales. 

mamie led me e e e ca ici e e duen El conjunto de los puntos de un 
cubo sólido es tridimensional. 

Pero, en cuanto se trata de ex- 

hojdado o acti mo men e tendra ma tadas tender este concepto a conjuntos 
más generales de puntos, surge 
la necesidad de dar una defini- 
ción precisa. ¿Qué dimensión 
deberá asignarse al conjunto de 
F:a, 130, —Conjunto de puntos de Cantor. puntos R formado por todos los 
puntos del eje x, de abscisa ra- 

cional? El conjunto de los puntos racionales es denso sobre el segmento, por lo 
que podría considerarse unidimensional como el propio segmento. Por otra par- 
te, existen algunas irracionales entre cualquier par de puntos racionales, como 
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sucede entre dos puntos cualesquiera de un conjunto finito de puntos, de for- 
ma que cabe considerar también que la dimensión del conjunto R es cero. 

Se plantea una cuestión aún más espinosa al tratar de asignar una dimensión 
al siguiente y curioso conjunto de puntos, que Cantor fué el primero en conside- 
rar. Suprímase en el segmento unidad la tercera parte central, que se compone de 
todos los puntos tales que 1/3 < z < 2/3. Llamemos C, al conjunto de puntos 
restantes. Suprímase ahora en cada uno de los dos segmentos en que está divi- 
dido C, el tercio central, llamando Ca al conjunto restante. Repítase este proceso, 
suprimiendo el tercio central de cada uno de los cuatro intervalos de Cs, con la 
que se obtiene un nuevo conjunto C3, y prosígase de esta manera formando los 
conjuntos Ca, Cs, Cs, +> . Llamemos C al conjunto de puntos del segmento uni- 
dad que quedan después de haber suprimido todos estos intervalos; es decir, C es 
el conjunto de todos los puntos comunes a todos los conjuntos de la sucesión inde- 
finida C1, Ca, Cs, +++ . Puesto que se suprimió un intervalo de longitud 1/3 en el 
prímer paso del proceso, dos intervalos de longitud 1/3% cada uno en el segundo, 
etcétera, la longitud total de los segmentos suprimidos es 


u zalo Us ni tii 2 2 y 
A e Y A Y A EN 


El paréntesis es una serie geométrica, cuya suma es 1/(1 — 2/3) = 3, de donde 
se deduce que la longitud total de los segmentos suprimidos es 1. Sin embargo, 
todavía quedan puntos en el conjunto C; p. ej., 1/3, 2/3, 1/9, 2/9, 7/9, 8/9, --* , que 
dividen en tres partes a los segmentos sucesivos. No es difícil ver que C se compone 
precisamente de todos aquellos puntos x, cuyo desarrollo en fracción indefinida 
en el sistema de base 3, puede escribirse en la forma 


adı as ag 
z= 3 tg ta 


an 
+ ... + Gn + A 
donde cada uno de los a; es 0 ó 2, mientras que el desarrollo análogo de cualquiera 
de los números suprimidos contendría al menos uno de los a, igual a 1. 

¿Cuál será la dimensión de este conjunto C? El proceso diagonal, utilizado 
para demostrar la no numerabilidad del conjunto de todos los números reales, 
puede modificarse de tal manera que proporcione el mismo resultado para el con- 
junto C. En consecúencia, parecerá que el conjunto C es unidimensional; sin em- 
bargo, C no contiene ningún intervalo completo, por pequeño que se suponga, 
por lo que también -podria pensarse que tiene la dimensión cero, como cualquier 
conjunto finito de puntos. Dentro del mismo orden de ideas, cabe preguntarse si 
el conjunto de puntos del plano obtenido levantando un segmento perpendicular 
de longitud unidad sobre todo punto racional o sobre cada punto del conjunto de 
Cantor C, debe considerarse de dimensión uno o dos. 

En 1912, Poincaré llamó la atención acerca de la necesidad de analizar más 
profundamente y de dar una definición precisa del concepto de dimensión. Poin- 
caré observó que la recta es unidimensional, debido a que podemos separar dos 
puntos cualesquiera de ella, cortándola en un solo punto (conjunto de dimen- 
sión cero), mientras el plano es bidimensional, porque para separar dos cuales- 
quiera de sus puntos debemos cortarlo'a lo largo de tpda' uha curva cerrada (con- 
junto de dimensión 1). Esto nos sugiere la naturaleza inductiva de la dimensión: 
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un espacio es n-d'mensional, si se pueden separar dos puntos cualesquiera de él 
suprimiendo un subconjunto de (n — 1) dimensiones, mientras no es siempre posi- 
ble obtener el mismo resultado suprimiendo un conjunto de menos dimensiones. 
Implícitamente, los Elementos de Euclides contienen una definición inductiva del 
concepto de dimensión, donde se dice que una figura unidimensional es aquella cuya 
frontera está compuesta de puntos; bidimensional si su frontera está formada por 
curvas, y tridimensional, aquella figura cuya frontera se compone de super- 
ficies. 

En los últimos años se ha desarrollado un extensa teoría del concepto de di- 
mensión. Una de las definiciones de dimensión comienza precisando el concepto de 
«conjunto de puntos de dimensión 0». Cualquier conjunto finito de puntos tiene la 
propiedad de que es posible encerrar cada punto del conjunto en una región del 
espacio arbitrariamente pequeña, que no contiene ningún otro punto del conjunto 
en su frontera. Esta propiedad es la adoptada actualmente como definición del 
conjunto de: dimensión cero y se conviene en decir que un conjunto vacío (que no 
contiene ningún punto) tiene dimensión —1. Entonces, un conjunto de puntos S 
tiene dimensión 0, si no es de dimensión —1 (es decir, si S contiene al menos un 
punto), y si cada punto de S puede encerrarse en una región arbitrariamente 
pequeña cuya frontera corte a S en un conjunto de dimensión —1 (es decir, no 
contenga ningún punto de S); p. ej., el conjunto de los puntos racionales de la 
recta tiene dimensión cero, puesto que todo punto racional puede ser centro de 
un intervalo arbitrariamente pequeño, cuyos extremos sean irracionales. Se ve 
también que el conjunto de Cantor, C, tiene dimensión cero, ya que, análoga- 
mente al conjunto de los puntos racionales, se obtiene eliminando un conjunto 
denso de puntos de la recta. 

Hasta ahora hemos definido solamente los conceptos de dimensión 0 y —1; la 
definición de dimensión 1 resulta inmediata: un conjunto S de puntos es de di- 
mensión 1, si no es de dimensión cero o —1, y si además cada punto de S puede 
encerrarse en una región arbitrariamente pequeña y tal que su frontera corte a $ 
en un conjunto de dimensión cero. Un segmento rectilineo tiene esta propiedad, 
puesto que la frontera de cualquier intervalo es un par de puntos, que es un con- 
junto de dimensión cero, de acuerdo con la definición anterior. Por otra parte, si 
se procede análogamente, podemos definir sucesivamente los conjuntos de dimen- 
sión 2, 3, 4, 5, ..., cada uno de los cuales se apoya en la definición precedente. 
Así, un conjunto S tendrá dimensión n si no es de dimensión menor; y si cada 
punto de S puede encerrarse en una región arbitrariamente pequeña, tal que su 
frontera corte a S en un conjunto de dimensión n—1; p. ej., el plano es de di- 
mensión 2, puesto que cada punto del mismo puede encerrarse dentro de un círcu- 
lo arbitrariamente pequeño, cuya circunferencia es de dimensión 11. Ningún con- 
junto de puntos en el espacio ordinario puede tener dimensión superior a 3, ya 
que cada punto del espacio puede ser centro de una esfera de radio arbitraria- 
mente pequeño, cuya superficie tiene dimensión 2. Pero, en la matemática mo- 
derna, se utiliza la palabra «espacio» para representar un sistema cualquiera de 
objetos para los cuales se ha definido el concepto de «distancia» y de «entorno» 
(véase Cap. VI, Sec. V, 4). Estos «espacios» abstractos pueden tener más de tres 


1 No pretende ser ésta una demostración rigurosa de que el plano tiene dimensión 2, 
de acuerdo con nuestra definición, ya que supone que la circunferencia de un círculo es 
de dimensión 1 y que el plano no tiene dimensión 0 ni 1. Pero puede darse una demostra- 
ción de estos hechos y de sus análogos para dimensiones mayores. Esta demostración nos 
dice que la definición de dimensión de un conjunto general de puntos no contradice los 
resultados conocidos de los conjuntos más sencillos. 
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dimensiones. Un. ejemplo sencillo es el espacio cartesiano de n dimensiones, cuyos 
«puntos» son conjuntos ordenados de n números reales: 


P= (21, Ta, M3)...» zn), 
Q = (Y1, Y2, Y3, » - - » Yn); 


y en el cual se define la «distancia» entre dos puntos P y Q por la igualdad 


dP, Q) = V (a — n? + (as — ya F e (a — Da). 


Puede demostrarse que este espacio tiene n dimensiones. Un espacio que no 
tiene dimensión ri, cualquiera que sea el entero n, se dice que es de dimensión 
infinita. Se conocen muchos ejemplos de tales espacios. 

Uno de los hechos más interesantes de la teoría de la dimensión es la siguiente 
propiedad característica dé las figuras de dos, tres y, en general, de n dimensio- 
nes. Consideremos primero el caso bidimensional. 
Si se subdivide cualquier figura sencilla bidimen- 
sional en un número de regiones suficientemente 
pequeñas (cada una de las cuales incluya a su 
frontera), existirán necesariamente puntos, en los 
que se encuentran tres o más de estas regiones, 
independientemente de su forma. Además, existen 
subdivisiones de la figura para las que cada punto 
pertenece, a lo sumo, a tres regiones de la subdi- 
visión. Así, si la figura bidimensional es un cua- 
drado, como en la figura 131, existe un punto que 
pertenece a las tres regiones 1, 2, 3; 'aúnque para 
esta subdivisión particular, ningún punto perte- 
nece a más de tres regiones. Análogamente, en el Fic. 131. —Teorema del recu- 
caso tridimensional puede demostrarse que, si se brimiento. 
descompone un volumen en otros suficientemente 
pequeños, existen siempre puntos comunes por. lo menos a cuatro de estos últi- 
mos, y que para una subdivisión adecuadamente elegida, no más de cuatro ten- 
drán un punto común. 

Estas observaciones sugieren el siguiente teorema, debido a Lebesgue y Brou- 
wer. Si se divide una figura de n dimensiones, de cualquier manera, en otras sub- 
regiones suficientemente pequeñas, siempre existirán puntos que pertenecerán, 
por lo menos, a n + 1 de ellas; además, en todos los casos es posible encontrar una 
subdivisión en regiones arbitrariamente pequeñas para la cual ningún punto per- 
tenezca a más de n + 1 regiones. Debido a la forma en que se realiza la subdivi- 
sión, este teorema se llama también teorema del «recubrimiento». Caracteriza la 
dimensión de cualquier figura geométrica: aquellas figuras para las cuales el teo- 
rema es válido son n dimensionales, mientras todas las demás tendrán otra dt- 
mensión. Por esta razón, se puede tomar como definición de dimensión, tal como 
hacen algunos autores. 

La dimensión de un conjunto cualquiera es una característica topológica del 
conjunto; dos figuras de diferente dimensión no pueden ser equivalentes topoló- 
gicamente. Éste es el famoso teorema topológico de la «invariabilidad de la di- 
mensión», cuya importancia resalta aún más, si se le compara con el hecho ex- 
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puesto en la página 94, referente a que el conjunto de puntos de un cuadrado 
tiene el mismo número cardinal que el de los puntos de un segmento rectilíneo. 
La correspondencia allí definida no es topológica, puesto que no se cumplen las 
condiciones de continuidad. 


*4. Un teorema de punto invariante.—En las aplicaciones de la 
topología a las otras ramas de la matemática, los teoremas referentes 
a «puntos fijos» desempeñan un importante papel. Un ejemplo típico 
es la siguiente proposición de Brouwer. Para la intuición resulta mu- 
cho menos evidente que la mayoría de los hechos topológicos. 

Consideremos un disco circular en el plano, con lo cual queremos 
significar el interior de un círculo, junto con su circunferencia. Su- 
pongamos que se someren los puntos de ese disco a una transforma- 
ción continua cualquiera (que no pre- 
cisa ser biunivoca), en la cual cada 
punto permanece interior al círculo, 
aunque cambie su situación. Por ejem- 
plo, puede encogerse, doblarse, esti- 
rarse o deformarse de cualquier ma- 
nera un delgado disco de goma, en 
tanto que la posición final de cada 
punto del disco permanezca interior a 
la circunferencia original. Así también, 
si, se pone en movimiénto el líquido 
contenido en una vasija, agitándolo 
de tal manera que las partículas de 
la superficie permanezcan | en ella, pero cambiando su posición, en un 
momento determinado la posición de esas partículas de la superficie 
define una transformación continua de su distribución -original. El 
teorema de Brouwer afirma que toda transformación de ese tipo deja 
invariable la posición de un punto por lo menos, es decir, existe al 
menos un punto cuya posición, después de la transformación, coincide 
con la que tenía inicialmente. (En el ejemplo de la superficie del 
líquido, el punto fijo, en general, cambiará de posición con el tiempo, 
aunque para una simple rotación circular el centro permanece siem- 
pre inmóvil.) La demostración de la existencia de un punto fijo es 
típica de la clase de razonamiento utilizado para establecer muchos 
teoremas topológicos. 

Consideremos el disco antes y después de la transformación y su- 
pongamos, contra lo que afirma el teorema, que ningún punto con- 
serva su posición anterior, por lo que, en la transformación, cada 
punto se traslada a otro punto, situado dentro del círculo o en su 





Fic. 132, — Vectores de transformación. 
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circunferencia, Asignemos a cada punto P del disco primitivo una 
flecha o «vector» en la dirección PP”, siendo P’ la imagen del punto P 
en la transformación. Para todo punto del disco existe dicho vector, 
pues se ha supuesto que cada uno de ellos variaba su posición. Consi- 
deremos ahora los puntos de la circunferencia del círculo con sus vec- 
tores asociados. Todos ellos están dirigidos hacia el interior del círculo, 
pues, por hipótesis, ningún punto se transforma en otro exterior al 
círculo. Comencemos por un punto cualquiera P, del contorno y. re- 
corramos la circunferencia en sentido contrario a las agujas de un 





Fic. 133. 


reloj. Al proceder así, cambiará la dirección del vector, pues los pun- 
tos del contorno tienen asociados vectores de dirección variable; las 
direcciones de estos vectores pueden ponerse de manifiesto trazando 
vectores paralelos por un puntó del plano. Observemos que, al atra- 
vesar el círculo partiendo de P para volver de nuevo a P), el vector 
gira y vuelve a su posición original. Designemos el número completo 
de vueltas dadas por este vector como el «índice» de los vectores del 
círculo; con más precisión, definamos el índice como la suma alge- 
braica de las distintas variaciones angulares de los vectores, de forma 
que las efectuadas en el sentido de las agujas del reloj se tomarán 
con signo negativo, mientras que consideraremos como positivas las 
realizadas en sentido contrario. El índice es la súma final que, a 
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priori, puede ser cualquiera de los números 0, +1, +2, +3, ..., corres- 
pondiendo a una variación total del ángulo de 0%, +3600, +7209, ... 
Nuestra afirmación es que el índice es igual a 1; esto es, que la varia- 
ción total en la dirección del vector es exactamente una vuelta posi- 
tiva completa. Para probarlo, recordemos que el vector asociado a 
cualquier punto P de la circunferencia está dirigido siempre hacia el 
interior del círculo y nunca en la dirección de la tangente. Ahora 
bien: si este vector girase un ángulo total distinto del ángulo total 
girado por el vector tangente (que es de 3600, ya que el vector tangente 
efectúa evidentemente una revolución positiva completa), entonces la 
diferencia entre los ángulos totales girados por el vector tangente y el 
vector transformación sería un múltiplo (distinto de 0) de 3609, ya 
que efectúa un número entero, de revoluciones. De ahí que el vector 
transformación deba girar completamente alrededor de la tangente 
por lo menos una vez, durante el circuito completo de Pı a Py y 
puesto que el vector transformación y el tangente giran continua- 
mente, en un cierto punto de la circunferencia el vector transformación 
debe coincidir con el tangente, lo que, como ya hemos visto, es in- 
posible. 

Si consideramos ahora una circunferencia cualquiera, concéntrica 
con la del disco e interior a ella, junto con los correspondientes vec- 
tores transformación de esta nueva circunferencia, el índice de dichos 
vectores para esta circunferencia debe ser 1. Pues si pasamos con 
continuidad de la circunferencia a cualquiera otra concéntrica, el ín- 
dice debe variar continuamente, ya que las direcciones de los vectores 
transformación varían continuamente de punto a punto, dentro del 
disco. Pero como el índice puede tomar sólo valores enteros, perma- 
necerá constantemente igual a 1, puesto que si saltara de 1 a cual- 
quier otro valor entero habría una discontinuidad en el valor del 
índice. (La conclusión de que debe ser constante una cantidad que 
varía continuamente, pero que sólo puede tomar valores. enteros, es 
una muestra típica de una clase de razonamiento matemático que 
interviene en muchas demostraciones.) Así podemos encontrar un 
círculo concéntrico tan pequeño como se quiera, para el cual el índice 
de los vectores transformación correspondientes es 1. Pero esto es 
imposible, puesto que de la supuesta continuidad de la transforma- 
ción, los vectores de un círculo suficientemente pequeño tendrán 
aproximadamente la misma dirección que el vector del centro del 
círculo. Así, pues, el cambio total de sus ángulos puede llegar a ser 
tan pequeño como se quiera, p. ej., menor que 10%, tomando un círculo 
suficientemente pequeño. En consecuencia, como el índice debe ser 
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un número entero, será igual a cero. Esta contradicción demuestra 
que es falsa nuestra hipótesis inicial, según la cual no existía ningún 
punto fijo en la transformación, con lo que queda completada la 
demostración. 

El teorema que acabamos de demostrar no sólo es válido para un 
disco, sino para cualquier otra región triangular o cuadrada, o para 
cualquier superficie que sea imagen de un disco en una transforma- 
ción topológica. Pues si A es una figura cualquiera, correlacionada 
con un disco mediante una transformación biunívoca y continua, una 
transformación continua de A en sí misma, que no tuviera punto fijo, 
definiría una transformación continua del disco en sí mismo,.sin punto 
fijo, y ya hemos demostrado que esto es imposible. El teorema con- 
serva su validez en tres dimensiones, para esferás o cubos, pero la 
demostración no es tan sencilla. 


Aunque para la intuición no resulta demasiado evidente el teorema del punto 
fijo de Brouwer, es fácil demostrarlo como consecuencia inmediata del hecho si- 
guiente, cuya evidencia es mucho más intuitiva: es imposible transformar con 
continuidad un disco circular en su circunferencia exclusivamente, de tal modo 
que todo punto de ésta permanezca fijo. Demostraremos que la existencia de una 
transformación, sin punto fijo, de un disco en sí mismo contradice dicha proposi- 
ción. Supongamos que P — P’ fuera una transformación de ese tipo; para cada 
punto P del disco: podemos trazar una flecha, que comienza en P’ y continúa, 
pasando por P, hasta que alcanza la circunferencia en algún punto P*. Entonces, 
la transformación P > P* sería continua y tal que transformaría el disco com- 
pleto en su circunferencia exclusivamente, dejando invariable todo punto de la 
circunferencia, contra la hipótesis de que una tal transformación es imposible. 
Puede utilizarse un razonamiento similar para establecer el teorema de Brouwer 
en tres dimensiones, para una esfera o un cubo. 

Es fácil vér que algunas figuras geométricas admiten transformaciones en sí 
mismas, cóntinuas y sin puntos fijos; p. ej., la región anular comprendida entre 
dos circunferencias concéntricás admite, como transformación continua sin puntos 
fijos, una rotación de ángulo cualquiera, no múltiplo de 3600, alrededor de su cen- 
tro. La superficie esférica admite, como transformación continua sin puntos fijos, 
la que lleva cada punto al diametralmente opuesto. Pero puede demostrarse me- 
diante razonamiento análogo al utilizado para el disco, que cualquier otra trans- 
formación continua que no haga corresponder a ningún punto el diametralmente 
opuesto (p. ej., cualquier pequeña deformación) tiene un punto fijo. 

Los teoremas del puñto fijo tales como éstos proporcionan un método po- 
tente para demostrar muchos «teoremas de existencia» que a primera vista no 
parecen tener carácter geométrico. Un ejemplo famoso es un teorema de punto 
fijo, sospechado por Poincaré en 1912, poco antes de su muerte. Este teorema 
tiene consecuencias inmediatas en la existencia de un número infinito de órbitas 
periódicas en el problema restringido de los tres cuerpos. Poincaré no pudo con- 
firmar su sospecha, y constituyó una gran hazaña de los matemáticos americanos 
el que, al año siguiente, G. D. Birkhoff consiguiera dar una demostración. Desde 
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entonces, los métodos topológicos se aplican con gran éxito al estudio del com- 
portamiento cualitativo de los sistemas dinámicos. 


5. Nudos.—Como último ejemplo, indicaremos que el estudio de 
los nudos ofrece difíciles problemas matemáticos de carácter topoló- 
gico. Un nudo se hace entrelazando un trozo de cuerda, después de 
lo cual se unen los extremos. La -curva cerrada resultante representa 
una figura geométrica que sigue siendo esencialmente la misma des- 
pués de deformar o retorcer. la cuerda, sin romperla. Pero ¿cómo es 
posible dar una caracterización intrínseca que permita distinguir una 
curva cerrada, con nudos, situada en el espacio, de otra sin ellos, 
como, p. ej., una circunferencia? La respuesta no es en modo alguno 
sencilla y menos todavía lo es el análisis matemático completo de las 





FiG. 134.— Nudos topológicamente equivalentes, que no se pueden deformar 
uno en el otro. 


distintas clases de nudos y de sus diferencias mutuas, Aun para los 
casos más sencillos esto ha resultado una tarea improba. Considé- 
rense los dos nudos triples que aparecen en la figura 134. Ambos son 
completamente simétricos, «imágenes especulares» uno del otro; son 
topológicamente equivalentes, pero no congruentes. Surge el problema 
de saber si es posible deformar uno de estos nudos en el otro de una 
forma continua. La respuesta es negativa, pero la demostración de 
este hecho requiere mayores conocimientos de la técnica topológica 
y de la teoría de grupos que es posible dar aquí. 


IV. CLASIFICACIÓN TOPOLÓGICA DE LAS SUPERFICIES 
1. Género de una superficie.—Al estudiar las superficies de dos 


dimensiones se plantean muchos e importantes problemas topológi- 
cos; p. ej., comparemos la superficie de una esfera con la de un toro. 
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Resulta evidente, de la figura 135, que ambas superficies difieren de 
un modo fundamental. Sobre la esfera, como en el plano, toda curva 
simple cerrada, tal como C, divide a la superficie en dos partes, mien- 
tras que en el toro existen curvas cerradas, tales como C’, que no 





Fic. 135.— Cortes en la esfera y el toro. 


dividen a la superficie en dos partes. Decir que C divide a la super- 
ficie esférica en dos partes significa que, si ésta: se corta a lo largo 
de C, se obtendrán dos trozos distintos e inconexos, lo que equivale 
a poder encontrar dos puntos 
de la superficie esférica tales 
que cualcuier curva esférica 
que los una deba cortar a C. 
Por otra parte, si se corta el 
toro a lo largo de la curva 
cerrada C’, la superficie re- 
sultante se mantiene todavía 
unida; cualquier punto de la 
superficie puede unirse con 
otro de la misma, mediante Fıc. 136, — Superficie de género 2. 
una curva que no corta a C’. ` 
Esta diferencia entre la esfera y el toro nos dice que ambos tipos de 
superficies son topológicamente distintos y nos prueba que es impo- 
sible transformar una en la otra de una manera continua. 
Consideremos ahora la superficie con dos agujeros representada 
en la figura 136. En ella se pueden trazar dos curvas cerradas, A y B, 
no mutuamente secantes, que no dividen a la superficie; en cambio, el 
toro queda dividido siempre en dos partes por dos cualesquiera de 
tales curvas. Por otra parte, tres curvas cerradas, que no se corten 
entre sí, dividen siempre a una superficie con dos agujeros. 
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Estos hechos nos inducen a definir el género de una superficie 
como el número máximo de curvas simples cerradas, no secantes 
entre sí, que pueden trazarse sobre la superficie sin dividirla. El gé- 
nero de la esfera es 0, el del toro es 1, mientras que el de la superfi- 
cie de la figura 136 es 2. Una superficie similar. con p agujeros tiene 
género p. El género es una propiedad topológica de una superficie 
que permanece invariable al deformarla. Recíprocamente, puede pro- 
barse (omitimos la demostración) que si dos superficies cerradas tienen 
el mismo. género, es posible deformar una en la otra, por lo que el 
género p =0, 1, 2, ... de una superficie cerrada la caracteriza com- 
pletamente desde el punto de vista topológico. (Suponemos que las 
superficies consideradas son superficies cerradas ordinarias de «dos 
caras». Más adelante consideraremos superficies de «una sola cara».) 
Por ejemplo, el buñuelo con dos agujeros y la esfera con dos asas de 
la figura 137 son ambas superficies cerradas de género 2; y es evi- 
dente que se puede deformar con continuidad cualquiera de las dos 
hasta obtener la otra. Puesto que el buñuelo con p agujeros, o su 
equivalente, la esfera de p asas, es de género p, podemos tomar cual- 
quiera de ellas.como representante topológico de todas las superficies 
cerradas de género p. 

*2. Caracterización euleriana de una superficie. —Supongamos que 
una superficie cerrada S de género p se divide en un cierto número de 





Fic. 137. — Superficies de género 2. 


regiones, marcando vértices sobre S y uniéndolos por arcos de curva. 
Vamos a demostrar que 


V-A+C=2-2p, 1 


donde V = número de vértices, A = número de arcos y C = número 
de regiones. El número 2 — 2p se llama característica de Euler de la 
superficie. Ya hemos visto que para la esfera V — A + C = 2, lo que 
coincide con [1], pues en este caso, p = 0. 

Para demostrar la fórmula general [1] podemos supóner que S es 
una esfera de p asas, pues, como ya hemos dicho, cualquier superfi- 
cie de género p puede deformarse continuamente en tal superficie, y 
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durante esta deformación permanecerán invariables los números 
V — A +C y 2 — 2p. Elegiremos la deformación de tal manera que 
las curvas cerradas As, A2, Bı, Ba ..., por donde las asas se unen a la 
esfera, estén formadas por arcos de la subdivisión dada (véase figu- 
ra 138, que aclara la demostración para el caso p = 2). 

Cortemos ahora la superficie S a lo largo de las curvas Az, Bj... 
y enderecemos las asas. Cada una tendrá una arista libre, limitada por 
una nueva curva A*, B*, ... con el mismo número de vértices y arcos 
que Az, Ba ..., respectivamente. Por tanto, V — A + C no variará, 
puesto que los nuevos vértices adicionales compensarán exactamente 





Ft. 138. 


los nuevos arcos, en tanto que no se crean asi nuevas regiones. Defor- 
memos ahora la superficie achatando las asas salientes, hasta que la 
superficie resultante sea simplemente una esfera, de la cual se han 
suprimido 2p regiones. Como V — A + C es igual a 2 para cualquier 
subdivisión de la esfera completa, tendremos 


V-A+C=2-2p 


para la esfera de la que se han suprimido 2p regiones, o sea, también 
para la primitiva esfera de p asas, según queríamos demostrar. 

La figura 121 aclara la aplicación de la fórmula [1] para una su- 
perficie S compuesta por polígonos planos. Dicha superficie puede de- 
formarse continuamente hasta convertirla en un toro, de tal forma 
que el género p sea igual a 1 y se tenga: 2 — 2p = 2— 2 = 0. Como 
prevé la fórmula [1] 


V— A = C = 16 — 32 + 16 = 0. 


Ejercicio: Subdivídase en regiones el buñuelo con dos agujeros de la figura 137 
y demuéstrese que V — A + C = —2. 


. 3. Superficies uniláteras.—Una superficie ordinaria tiene siempre 
dos caras, lo cual se aplica tanto a las superficies cerradas (la esfera 
o el toro) como a las superficies limitadas por curvas (el disco, o un 
toro del cual se ha suprimido un pedazo). Las dos caras de una su- 
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perficie de esa: clase podrían pintarse de distintos colores para distin- 
guirlas. Si la superficie es cerrada, los dos colores quedan separados; 
si está limitada por curvas, los dos colores se encuentran sólo a lo 
largo de éstas. Un insecto que caminase por una de esas superficies, 





NA 





FiG. 139. — Construcción de la cinta de Moebius, 


y al que se le impidiera atravesar las curvas que forman el contorno 
(si existe), permanecería siempre sobre la misma cara. 

Moebius hizo el descubrimiento sorprendente de que existen su- 
perficies de una sola cara. La más sencilla de dichas superficies, lla- 
mada cinta o banda de Moebius, se forma tomando una tira larga 
y rectangular de papel y pegando sus dos extremos después de darle 
media vuelta, como indica la figura 139. Un insecto que recorriera 
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esta superficie, manteniéndose siem- 
pre en el eje de la cinta, volvería a su 
posición de partida. 

La banda de Moebius tiene sólo 
un borde, pues su frontera consiste 
en una curva cerrada única. La su- 
perficie ordinaria de dos caras, for- 
mada pegando los dos extremos de un 
rectángulo, sin retorcerlo, está limita- 
da por dos curvas distintas. Si se 
corta esta última banda, a lo largo de 
la línea central, se descompone en 
otras dos bandas del mismo tipo. 
Pero si se corta la superficie de Moe- 





Fic. 140, — Cofia cruzada. 


bins a lo largo de dicha línea (Fig. 139), vemos que sigue siendo de 
una sola pieza. No es fácil que quien no conozca previamente la super- 
ficie de Moebius prevea esto, pues es opuesto a lo que la intuición 
nos dice que «debiera» ocurrir. Si la superficie que resulta después de 
cortar la cinta de Moebius a lo largo de su eje se corta de nuevo en 

igual forma, resultan dos nuevas 





superficies del mismo tipo, pero 
entrelazadas. 

Constituye un pasatiempo en- 
tretenido cortar dichas superficies 
a lo largo de líneas paralelas al 
borde a una distancia de 1/2, 
1/3, etc., de la anchura total. El 
contorno de la cinta de Moebius 
es una curva cerrada, simple y sin 
nudos, que puede convertirse por 
deformación en una curva plana; 
p. ej., una circunferencia, Al efec- 
tuar la deformación puede permi- 
tirse que la superficie se corte a sí 
misma, de modo que resulte una 
superficie de una sola cara que se 
corta a sí misma, como está repre- 
sentada en la figura 140 (cofia 
cruzada). Se considera que la línea 


de autointersección está compuesta 


Fic. 141.—Cinta de Moebius de contorno 
plano triangular. 


en realidad de otras dos, cada una 
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de ellas perteneciente a una de las dos porciones que se cortan en 
ella. La unilateralidad de lå cinta de Moebius queda conservada, 
puesto que dicha propiedad es topológica; es imposible deformar con- 
tinuamente una superficie de una sola cara en otra de dos caras. 
Aunque resulta sorprendente, es posible realizar la deformación dé 
manera que el contorno de la cinta de Moebius se haga plano (p. ej., 
triangular), mientras la banda permanece sin cortarse a sí misma. La 
figura 141 representa dicho modelo, que ha sido ideado por B. Tuc- 
kermann. El contorno es un triángulo, mitad de un cuadrado diago- 
nal de un octaedro regular. La banda consta de seis caras del octaedro 
y cuatro triángulos rectángulos, cada uno un cuarto de un plano 
diagonal. 

Otra superficie unilátera interesante es la botella de Klein. Es una 
superficie cerrada, pero no tiene ni exterior ni interior. Topológica- 
mente equivale a un par de cofías 
cruzadas, cuyos contornos coin- 
ciden. 

Puede demostrarse que cual- 
quier superficie cerrada, de una sola 
à cara, de género p = 1, 2, ..., es 

Fic. 142. — Botella de Klein. topológicamente equivalente a una 

esfera, en la cual se han suprimido 
p discos y se los ha reemplazado por otras tantas cofias cruzadas. De 
ahí se deduce fácilmente que la característica euleriana V — A + C 
de una superficie de ese tipo está relacionada con p por la ecuación 





V—A+C=2-—_p. 


La demostración es análoga a la correspondiente para superficies de dos caras. 
Demostraremos, primero, que la característica euleriana de una cofia cruzada, o de 
una cinta de Moebius, es 0. Para conseguirlo, observaremos que si se corta de tra- 
vés una superficie de Moebius, subdividida previamente en un cierto número de 
regiones, se obtiene un rectángulo que contiene dos vértices más, una arista más 
y el mismo número de regiones que la superficie de Moebius. Para el rectángulo, 
V — A +C = 1, como se ha visto en la página 251. De ahí que, para la super- 
ficie de Moebius, sea V — A + C = 0. El lector puede completar la demostración 
como ejercicio. 


Resulta mucho más sencillo estudiar la naturaleza topológica de 
superficies como éstas mediante polígonos planos, en los cuales se 
identifican conceptualmente ciertos pares de aristas (véase Cap. IV, 
Apéndice). En los diagramas de la figura 143 las flechas se hacen 
coincidir, real o conceptualmente, en posición y dirección. 
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A A A A 
B B A A 
Cilindro. Toro. 
A B Á A 
B A A A 
Cinta de Moebius. Botella de Klein. 


Fic. 143. — Superficies cerradas definidas por coordinación de aristas 
en una figura plana. 





Fia, 144.— Toro tridimensional definido por identificación de contorno. 
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Puede utilizarse también este método de identificación para definir 
variedades cerradas tridimensionales, análogas a las superficies cerra- 
das bidimensionales; p. ej., si identificamos los puntos correspondien- 
tes de las caras opuestas de un cubo (Fig. 144), obtenemos una varie- 
dad cerrada tridimensional, llamada toro tridimensional. Esta varie- 
dad equivale topológicamente al espacio comprendido entre dos toros 





FiG. 145,— Otra representación del toro tridimensional (ìa sección indica 
la identificación). 


concéntricos, uno dentro del otro, en el cual se identifican los puntos 
correspondientes de ambas superficies (Fig. 145). Esta última varie- 
dad resulta a partir de un cubo en el cual se hagan coincidir dos pa- 
res de caras identificadas conceptualmente. 


APÉNDICE 


*1. El teorema de los cinco colores. —Basándonos en la fórmula de 
Euler podemos demostrar que es posible iluminar adecuadamente 
cualquier mapa sobre una superficie esférica utilizando, a lo más, 
cinco colores distintos. (Según lo dicho en la pág. 258, se considera que 
un mapa está adecuadamente iluminado si dos regiones contiguas, 
que tienen como límite común: todo un segmento de sus fronteras, no 
están pintadas con el mismo color.) Nos limitaremos a aquellos mapas 
cuyas regiones están limitadas por polígonos simples cerrados, com- 
puestos de arcos circulares, Podemos suponer también que en cada 
vértice se encuentran exactamente tres arcos; diremos que un mapa 
de este tipo es regular. Si reemplazamos cada vértice en el que con- 
curran más de tres arcos por un pequeño círculo y unimos el interior 
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de cada uno de esos círculos a una de las regiones que se encuentran 
en el vértice, tenemos un nuevo mapa, en el cual los vértices múl- 
tiples vienen reemplazados por un cierto número de vértices triples. 
El nuevo mapa contendrá el mismo número de regiones que el pri- 
mitivo. Si este nuevo mapa, que es regular, se puede iluminar ade- 
cuadamente con cinco colores, haciendo que disminuya el radio de 
los círculos hasta convertirse en puntos, tendremos iluminado en la 
forma deseada el mapa primitivo. Por ello, basta demostrar que cual- 
quier mapa regular sobre la superficie esférica puede iluminarse con 
cinco colores. 

En primer lugar, demostraremos que todo mapa regular debe con- 
tener al menos un polígono de menos de seis lados. Sea Fn el número 
de regiones de n lados en un mapa regular; si es C el número total 
de regiones, 

C= Fait Fst Fit (1] 


Cada arco tiene dos extremos y en cada vértice se encuentran tres 
arcos. De ahí que si A indica el número de arcos del mapa y V el 


de vértices, 
2A = 3V. 12 


Además, una región limitada por n arcos tiene n vértices, y cada vér- 
tice pertenece a tres regiones, por lo que 


2A = 3V = 2F + 3F3 + 4F4+:"*. [3] 
Por la fórmula de Euler, se tiene 
V-A+C=2 o 6Y-64+4+6C=12, 


De [2] se deduce que 6V = 44, por lo que 6C — 2A = 12. 
Por tanto, de [1] y [3] resulta: 


(Fs + Fa + Fa + e") — (QF3 + 3F3 + 4F4 + +t) [= 12, 


(6 — 2)Fa + (6 — 3)F3 + (6 — 4)Fa + (6 — 5) Fs + (6 — 6) Fo + 
+ (6 — 7)F7 + +° = 12, 

Por lo menos uno de los términos del primer miembro debe ser 
positivo, así que, al menos, uno de los números Fa, Fs, Fa, Fs es 
positivo, como queríamos demostrar. 

Vamos a probar ahora el teorema de los cinco colores. Sea M un 
mapa regular cualquiera sobre la superficie esférica, que tiene en 
total n regiones. Sabemos que por. lo menos una de estas regiones 
debe tener menos de seis lados. 
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Caso 1. M contiene una región A de 2, 3 6 4 lados. En este caso, 

se suprime la frontera entre A y una de las regiones limítrofes. (Si A 
tiene cuatro lados, una región puede extenderse y tocar dos lados 
de A no adyacentes. En este caso, 


por el teorema de la curva de 

Jordan, quedarán diferenciadas las 
A regiones que tocan los otros dos 

lados de A, y suprimimos la fron- 

tera entre A y una de las últimas 
M M 


regiones.) 
Fia. 146. El mapa resultante, M’, será 
regular, con n — 1 regiones. Si M’ 
se puede iluminar con cinco colores, lo mismo puede hacerse con M. 
Dado que a lo más cuatro regiones de M limitan con A, siempre 
podremos encontrar un quinto color para A. 

Caso 2. M contiene una región A con cinco lados. Consideremos 
las cinco regiones limítrofes con A y llamémoslas B, C, D, E, y F. 
Podremos encontrar siempre entre ellas un par sin frontera común; 
pues si, p. ej., B y D se tocan, impiden que C toque a E o F, ya que 


cualquier camino que conduzca de C a E o F tendrá que atravesar 
por lo menos una de las regiones A, B o D (Fig. 147). (Es evidente 
que este hecho. depende también del teorema de la curva de Jordan, 
cierto para el plano o la esfera, pero no válido para el toro, p. ej.) 
En consecuencia, podemos suponer que, p. ej., € y F no se tocan. 
Suprimimos los lados de A que limitan con C y F, formando así un 
nuevo mapa M' con n — 2 regiones, que también es regular. Si el 
nuevo mapa se puede iluminar con cinco colores, puede hacerse lo mismo 
con el mapa original M. Pues cuando se restablecen las fronteras, A 
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no estará en contacto con más de cuatro colores diferentes, ya que 
C y F tienen el mismo color, y siempre podremos encontrar un quinto 
color para A. 

Así, en cualquiera de los casos, si M es un mapa regular de n regio- 
nes, podemos construir otro nuevo mapa regular, M’, que tiene n— 1 
ó n — 2 regiones, y tal que si se puede iluminar M’ con cinco colores, 
cabe hacer lo mismo con M. Este proceso se puede aplicar también 
a M’, etc., lo que conduce a una sucesión de mapas deducidos de M: 


M, M’, M”, 


Dado que el número de regiones de esta sucesión de mapas decrece 
constantemente, debemos llegar al fin a un mapa con no más de cinco 
regiones, el cual se puede siempre iluminar con cinco colores a lo 
sumo. De ahí, volviendo paso a paso hasta M, vemos que también 
éste puede iluminarse con cinco coiores, con lo que queda terminada 
la demostración. Obsérvese que la prueba es constructiva, ya que 
proporciona un método perfectamente practicable, aunque laborioso, 
para iluminar efectivamente cualquier mapa de n regiones en un 
número finito de pasos. l 

2. El teorema de la curva de Jordan para polígonos.—El teorema 
de Jordan dice que cualquier curva simple y cerrada C divide a los 
puntos del plano no situados sobre C en dos recintos distintos (que 
no tienen punto alguno común), de los cuales C es la frontera común. 
Daremos una demostración de este teorema para el caso en que C 
sea un poligono cerrado P. 

Probaremos que los puntos del plano que no se hallan sobre P 
quedan subdivididos en dos clases, A y B, de ta] manera que dos 
puntos cualesquiera de la mis- 
ma clase pueden unirse median- 
te una poligonal que no corta a 
P, mientras que cualquier poli- 
gonal que una un punto de A 
con otro de B debe cortar a P. 
La clase A formará el «exterior» 
del polígono, mientras que la B 
constituye el «interior». 

Iniciaremos la demostración Fia., 148,—Cómputo de intersecciones. 
eligiendo una dirección fija en 
el plano, no paralela a ninguno de los lados de P; como P tiene un 
número finito de lados, esto es siempre posible. Definiremos ahora las 
clases A y B en la forma siguiente: 
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El punto p pertenece a A si el rayo que pasa por p en la dirección 
prefijada corta a P en un número par de puntos 0, 2, 4, 6, ... El punto 
p pertenece a B si el rayo que pasa por p en dicha dirección corta a P 
en un número impar de puntos 1, 3, 5, 

En lo que respecta a las rayos que pasen por los vértices de P, 
< no los contaremos como intersecciones si los lados de P que: se cor- 
tan en ellos se encuentran del mismo lado del rayo; pero considerare- 
mos que hay intersección si ambos lados se encuentran en distinta 
parte del rayo. Diremos que dos puntos, p y q, tienen la misma «pa- 
ridad» si pertenecen a la misma clase, A o B. l 

Observaremos, en primer lugar, que todos los puntos. de un seg- 
mento rectilíneo que no corta a P tienen la misma paridad. Pues la 
paridad de un punto p que se mueve a lo largo de un tal segmento, 
puede cambiar sólo cuando el rayo en la dirección fija trazado por p 
pasa por un vértice de P; y en ninguno de los casos posibles cambiará 
la paridad, debido al convenio 
que acabamos de hacer, De esto 
se deduce que si se une un 
punto pı de A con otro pa de 
B mediante una poligonal, ésta 
debe cortar a P; pues en otro 
caso, la paridad de todos los 
puntos de la trayectoria, y en 
particular de pı y pz, sería la 

FIG. 149. misma. Además, podemos de- 

mostrar que dos puntos cuales- 

quiera de la misma clase, A o B, pueden unirse mediante una poligonal 
que no corta a P. Sean p y q los dos puntos; si el segmento rectilíneo 
Pq, que une p con q, no corta a P, es la poligonal buscada. En caso 
contrario, sea p”“el primer punto de intersección de ese segmento 
con P, y q' el último (Fig. 149). Construyamos la poligonal que arran- 
ca de p, a lo largo del segmento pp', que se desvía antes de llegar a 
p', y sigue a lo largo de P hasta que P encuentra a pg en q”. Si pode- 
mos demostrar que esta poligonal corta a pq entre q' y q y no entre 
p' y q, podrá continuarse aquélla hacia q, siguiendo g'g, sin cortar 
a P. Es evidente que dos puntos cualesquiera, r y s, muy próximos 
entre sí, pero a distinto lado de algún segmento de P, deben tener 
distinta paridad, pues el rayo que pasa por r cortará a P en un punto 
más que el rayo que pasa por s. Vemos así que la paridad cambia 
cuando atravesamos el punto g’ a lo largo del segmento pg. Se sigue 
de ello que la poligonal de trazos debe cortar a pq entre q' y q, ya que 
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P y 4 (y, en consecuencia, cualquier otro punto de la línea de trazos) 
tienen la misma paridad. 

Esto completa la demostración del teorema de la curva de Jordan 
para el caso de un polígono P. Puede identificarse ahora el «exterior» 
de P con la clase A, puesto que si nos alejamos lo suficiente a lo 
largo de.un rayo cualquiera en la dirección fijada, llegaremos a un 
punto más allá del cual no existirá intersección con P, por lo que 
todos esos puntos tienen paridad 0, y pertenecen a A. Esto identifica - 
el «interior» de P con la clase B. No importa lo complicado que sea 
el polígono P, pues siempre podremos determinar si un punto dado p 
del plano está dentro o fuera de P, trazando un rayo y contando el 
número de sus intersecciones con P. Si éste es impar, el punto p se 
encuentra dentro de P, y no puede salir de su interior sin atravesar P 
en algún punto. Si el número de puntos de intersección es par, el 
punto p es exterior a P (véase Fig. 128). 

*Se puede demostrar el teorema de la curva de Jordan para los polígonos de 
la siguiente manera: defínase el orden de un punto po respecto a una curva cerrada 
cualquiera C, que no pasa por po, como el número de revoluciones completas que 


efectúa el radio vector que une po con un punto móvil p’ sobre la curva, mientras 
éste recorre toda la curva una sola vez. Sea 


A =el conjunto de los puntos po que no se encuentran sobre P y que 
tienen un orden par respecto a P, 

B = el conjunto de los puntos po que no: se encuentran sobre P y que 
tienen un orden impar respecto a P. 


Entonces, los conjuntos A y B así definidos forman, respectivamente, el exterior yel 
interior de P. Se deja como ejercicio al lector efectuar la demostración con detalle. 





**3, El teorema fundamental del álgebra.—El «teorema funda- 
mental del álgebra» dice que si 


(2) =22 + Ap 1214 Op-92 02 + +++ + aiz + ao 11] 


es un polinomio, en el cual n >1 y an. 1, An-2,..., ao, Números complejos 
cualesquiera, existe un número complejo « tal que f(«) = 0. Dicho de 
otra manera: en el campo de los números complejos, toda ecuación polinó- 
mica tiene una raíz. [Vimos en la pág. 110 que de ello se deduce la 
posibilidad de descomponer [(z) en el producto de n factores lineales: 


IE) = (2 — a1) (2 — a2) **- (2 — an), 


siendo 0, %2, ... » %n, los ceros de f(z).] Es notable que este teorema 
pueda demostrarse mediante consideraciones de carácter topológico, 
relacionadas con las que se utilizaron para demostrar el teorema de 
Brouwer del punto fijo. 

Recordará el lector que un número complejo es un símbolo x+-iy, 
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en el cual, tanto x como y son números reales e i tiene la propiedad 
de que i? = —1. Puede representarse el número complejo z + iy me- 
diante el punto del plano cuyas coordenadas, respecto a un par de 
ejes perpendiculares, son x e y. Si en ese plano introducimos coorde- 
nadas polares, tomando el origen y la dirección positiva del eje de 
las x como polo y eje polar respectivamente, podemos escribir: 


z = x + iy = r (cos 0 + i sen 0), 
siendo r = y x8 + y2. Se deduce de la fórmula de De Moivre que 
zn = m (cos nð + i sen n8) 


(véase pág. 105). Así, pues, si hacemos que el número complejo z 
describa una circunferencia de radio r y centro en el origen, z” des- 
cribirá n veces una circunferencia completa de radio r» mientras z 
describe la suya una sola vez. Recordemos también que r, módulo de z, 





FiG. 150. — Demostración del teorema fundamental del álgebra. 


que se expresa mediante el símbolo | z |, da la distancia de z a O, y 
que si z’ =x' + iy”, la distancia entre z y z’ es |z — z’ |. Después de 
estos preliminares, podemos proceder a la demostración del teorema. 

Supongamos que el polinomio [1] no tiene raíces, de donde re- 
sulta que para todo número complejo z se tiene: 


12) 40. 
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Supuesto esto, si hacemos que z describa cualquier curva cerrada en 
el plano zx, y, f(z) describirá una curva cerrada T, que no pasará por 
el origen (Fig. 150). Podemos, por tanto, definir el orden del origen O 
respecto a la función f(z) para cualquier curva cerrada C como el nú- 
mero total de revoluciones completas que- efectúa el radio vector que une O 
con un punto de la curva T trazadá por el punto representativo de f(z), 
mientras z recorre la curva C. Como curva C tomaremos una circun- 
ferencia de centro O y de radio t y definimos la función (t) como el 
orden de O respecto å la función f(z) para el círculo de centro O y 
radio tł. Es evidente que q(0) = 0, puesto que un círculo de radio 
igual a cero es un punto y la curva I se reduce al punto (0) + O. 
En el próximo párrafo demostraremos que q(f) =n para valores 
grandes de t. Pero el orden p(t) depende con continuidad de t, ya que 
f(z) es una función continua de z. De ahí resulta una contradicción, 
pues la función q(t) sólo puede tomar valores enteros y, en conse- 
cuencia, no puede pasar con continuidad del valor 0 al valor n. 

Queda sólo por probar que ọ(t) =n para valores grandes de tł. 
Obsérvese que en un círculo de radio z = t, tal que 


t>1 y t>ļjæ|+]|aj+ > +|anıl, 
tenemos la desigualdad 


K — z | = | apt + + ao | < lana le |z (24 





ao 
+ |an- |: [21024 + | ao] = Pi] | anail +e + ajk 


< i [| an| + |an- +0 +]00l]<tit=|z], 


Dado que el primer miembro es la distancia entre los puntos zh y 
Í(z), mientras el último es la distancia del punto z” al origen, vemos 
que el segmento rectilíneo que une los dos puntos f(z) y z” no puede 
pasar por el origen en tanto z se encuentre sobre la circunferencia 
de radio t y centro en el origen. Siendo esto así, podemos deformar 
continuamente la curva trazada por f(z) hasta obtener la descrita por 
zn, sin pasar nunca por el origen, trasladando simplemente todo punto 
de f(z) a lo largo del segmento que lo une con z”. Como el orden del 
origen varía con continuidad y puede tomar sólo valores enteros du- 
rante esa deformación, debe ser el mismo para ambas curvas. Como 
el orden de zh es n, el de f(z) ha de ser también n, con lo que la de- 
mostración queda ultimada. 


CAPÍTULO VI 
FUNCIONES Y LÍMITES 


Introducción.—La parte principal de la matemática moderna se 
centra en torno a los conceptos de función y límite. En este capítulo 
los analizaremos de forma sistemática. 

Una expresión tal como 

l r + 2r- 3 


no tiene valor definido mientras no se le asigne un valor a x; decimos 
que el valor de esta expresión es una función del valor de z, y escribimos: 


xa + 2r — 3 = f(x). 


Por ejemplo, para x = 2, resulta 22 + 2 - 2 — 3 = 5, por lo que 
f(2) = 5. De la misma manera, por sustitución directa, podemos ha- 
llar el valor de f(x) para cualquier valor entero, fraccionario, irracio- 
nal o incluso complejo de x. 

El número de primos menores que n es una función r(n) del en- 
tero n. Dado un valor de n, x(n) está determinado, aunque no se 
conoce ninguna expresión algebraica que permita calcularlo. El área 
de un triángulo es función de las longitudes de sus tres lados; varía 
al variar éstas y está determinada cuando estas longitudes toman 
valores definidos. Si se somete un plano a una transformación pro- 
yectiva o topológica, las coordenadas de un punto, después de efec- 
tuada la transformación, dependen, es decir, son funciones de las 
coordenadas primitivas. El concepto de función aparece en cuanto se 
relacionan cantidades mediante una relación física determinada. El 
volumen de un gas encerrado en un cilindro es función de la tempera- 
tura y de la presión que ejerce el pistón. La presión atmosférica, ob- 
servada en un globo, es función de su altitud sobre el nivel del mar. 
Todo el campo de los fenómenos periódicos—las mareas, las vibracio- 
nes de una cuerda, la emisión de ondas luminosas por un filamento 
incandescente—está regido por las funciones trigonométricas elemen- 
tales sen x y cos x. 

Para Leibniz (1646-1716), el primero que utilizó la palabra «fun- 
ción», y para los matemáticos del siglo xvir, el concepto de relación 
funcional estaba más o menos identificado con la existencia de una 
fórmula matemática sencilla que expresara la naturaleza exacta de 
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esa relación. Este concepto resultó ser demasiado restrictivo para las 
necesidades de la física matemática, por lo que la idea de función, 
junto con el concepto anejo de límite, hubo de pasar por un largo 
proceso de generalización y clarificación, del cual daremos una su- 
cinta exposición en este capítulo. 


I. VARIABLE Y FUNCIÓN 


1. Definiciones y ejemplos.—Se nos ofrecen a menudo entes mate- 
máticos que estamos en libertad de elegir arbitrariamente entre todo 
un conjunto S de objetos. Llamaremos variable a un objeto de esa 
clase, perteneciente al campo o dominio S. Es costumbre utilizar las 
últimas letras del abecedario para designar las variables; p. ej., si S 
designa el conjunto de todos los números enteros, la variable X, defi- 
nida en el dominio S, representa un entero arbitrario. Decimos' que 
«la variable X varía en el conjunto S» significando que podemos 
identificarla con cualquier :lemento del conjunto S. Conviene uti- 
lizar variables cuando deseamos hacer afirmaciones acerca de obje- 
tos elegidos arbitrariamente dentro de un conjunto; p. ej., si S sigue 
representando el conjunto de los números enteros, y X e Y son dos 
variables en el dominio S, la afirmación 


X+4Y=Y+X' 


es una expresión simbólica conveniente del hecho de que la suma de 
dos enteros es independiente del orden en que se tomen. Un caso 
particular está expresado por la igualdad 


24+3=3+2, 


en la cual aparecen sólo constantes. Para expresar la ley general, válida 
para cualquier par de números, se necesitan símbolos con el signifi- 
cado de variables, 

No es necesario que el dominio S de la: variable X sea un con- 
junto de números; p. ej., S puede ser el conjunto de todos los círculos 
del plano; X representará entonces un círculo determinado. O bien, 
S puede representar el conjunto de todos los polígonos cerrados del 
plano, siendo entonces X uno cualquiera de ellos. Tampoco es nece- 
sario que el dominio de una variable contenga un número infinito 
de elementos; p. ej., X puede denotar uno cualquiera de los miembros 
de la población S de una ciudad determinada en un momento prefi- 
jado. O bien, X puede significar uno cualquiera de los restos posibles 
cuando se divide un entero por 5; en este caso, el dominio S se com- 
pone de los cinco números 0, 1, 2, 3, 4. 


COURANT.—11 
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El caso más importante de una variable numérica—para desig- 
narla se suele utilizar la letra x——es aquel en que el dominio de varia- 
bilidad S es un intervalo a <x < b del eje numérico real. En este 
caso, diremos que x es una variable continua en dicho intervalo. El 
dominio de variabilidad de una variable continua puede extenderse 
hasta el infinito. Así, S puede ser el conjunto de todos los números 
reales y positivos, x > 0, o el conjunto de todos los números reales 
sin excepción. De manera similar, podemos considerar una variable X 
cuyos valores sean los puntos de un plano, o de un dominio dado del 
mismo, tal como el interior de un rectángulo o de un círculo. Puesto 
que cada punto del plano está definido por sus dos coordenadas zx e y 
respecto a un par fijo de ejes, en este caso diremos usualmente que 
tenemos un par de variables continuas, x e y. 

Puede ocurrir que a cada valor de la variable X esté asociado otro 
valor determinado de otra variable U. Se dice entonces que U es 
una función de X. El modo como ambas están enlazadas se expresa 
mediante un símbolo, tal como 


U = F(X) (léase: «F de X»). 


Si X varía en el conjunto S, la variable U variará en otro con- 
junto, que llamaremos, p. ej., T. Si S representa el conjunto de todos 
los triángulos X del plano, se puede definir una función F(X) asig- 
nando a cada triángulo la longitud U = F(X) de su perímetro; T será 
entonces el conjunto de todos los números positivos. Observemos que 
dos triángulos distintos, Xı y X2, pueden tener el mismo perímetro, 
por lo que es posible la igualdad F(X1) = F(X2), aunque sea X, 4 X2. 
Una transformación proyectiva de un plano S en otro T asigna a 
cada punto X de S un solo punto U de T, de acuerdo con una regla 
perfectamente establecida, que podemos expresar mediante el símbolo 
funcional U = F(X). En este caso, F(X1) 4 F(X2) si Xı 4 Xə, por 
lo que diremos que la representación de S en T es biuntvoca (véase 
página 86). 

A menudo, se definen las funciones de una variable continua me- 
diante expresiones algebraicas; he aquí algunos ejemplos: * 

1 1 
u = 22, u = T’ u= TEx 

En la primera y en la última de estas expresiones, x varía en el 
conjunto completo de los números reales, mientras que en la segun- 
da, x puede tomar cualquier valor real, excepto el 0, excluyéndose 
este valor, ya que 1/0 no es un número. 
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El número B(n) de los divisores primos de n es una función de n, 
en la cual n varía en el dominio de todos los números naturales. Con 
mayor generalidad, cualquier sucesión de números a;, dz, 03, ... , pue- 
de considerarse como el conjunto de valores de una función u = F(n), 
donde el dominio de variabilidad de la variable independiente n es el 
conjunto de los números naturales. Sólo por brevedad, designamos 
mediante an el n-ésimo término de la sucesión, en lugar de usar la 
notación funcional más explícita F(n). Las expresiones consideradas 
en el capítulo primero: 








n(n + 1) 
Sn) =142 +n m De 
n(n 1) (2n 1 
San) = 12 +22 +- 4n = (n + X + ) 
nAn + 1)? 


Sa(n) = 184 23 + 4n s 3 , 
son funciones de la variable entera n. 

Si U = F(X), se reserva de ordinario el nombre de variable inde- 
pendiente para X, mientras que U se llama variable dependiente, ya 
que su valor depende del valor elegido para X. 

Puede ocurrir que se asigne el mismo valor U a todos los valores 
de X, estando formado ahora el conjunto T exclusivamente por un 
solo elemento. Tenemos entonces un caso especial, en el cual el valor U 
de la función no varía; es decir, U es constante. Incluiremos este caso 
dentro del concepto general de función, aunque pueda parecer ex- 
traño al principiante, a quien, naturalmente, le parece que la impor- 
tancia del concepto radica en que U varía al variar X. Pero no nos 
causará ninguna dificultad y, de hecho, será útil el considerar una 
constante como caso especial de una variable cuyo «dominio de varia- 
bilidad» se compone de un solo elemento. 

El concepto de función es de capital importancia, no sólo en la 
matemática pura, sino también en las aplicaciones prácticas. Las 
leyes de la física no son sino proposiciones respecto a la forma en que 
dependen ciertas cantidades de otras, cuando algunas de éstas varían. 
Asi, el tono de la nota emitida por una cuerda vibrante depende de 
su longitud, de su peso y de la tensión a que está sometida; la pre- 
sión atmosférica depende de la altitud; la energía de una bala, de su 
masa y de su velocidad. La tarea del físico cónsiste en determinar la 
naturaleza exacta o aproximada de esa dependencia funcional. 

El concepto de función permite una caracterización exacta del 
movimiento. Si una partícula en movimiento se considera reducida a 
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un punto en un espacio de tres dimensiones, siendo zx, y, z sus Coor- 
denadas rectangulares y designando por t el tiempo, su movimiento 
queda completamente determinado si se dan sus coordenadas x, y, z 
como funciones de t: 


z=f(0, y=g9g0,  2=hk0. 


Así, si una partícula cae libremente a lo largo del eje vertical z, 
bajo la sola influencia de la gravedad, 


x=0, y =0, z= — je, 


donde g es la aceleración de la gravedad. Si una partícula gira unifor- 
memente en una circunferencia de radio unidad, en el plano zx, y, su 
movimiento está caracterizado por las funciones 


x = COS oX, y = sen ot, 


donde « es una constante, llamada velocidad angular del movimiento. 

Una función matemática no es más que una ley que regula” la 
interdependencia de cantidades variables. -No presupone la existencia 
de una relación de «causa y efecto» entre ellas, Aunque en el lenguaje 
corriente se utiliza a menudo la palabra «función» con este último 
sentido, evitaremos todas esas interpretaciones filosóficas; p. ej., la 
ley de Boyle afirma que para un gas contenido en un recipiente, a 
temperatura constante, el producto de la presión p y el volumen v 
es una constante c (cuyo valor depende a su vez de la temperatura); 
es decir: 

pv=.<C. 


Esta relación permite despejar p en función de v, o v en función de p; 
p = chb, o bien, v =c/p, lo que no significa necesariamente que un 
cambio de presión sea la «causa» de la variación del volumen, ni tam- 
poco lo contrario. Para el matemático, lo único que importa es la 
forma de la relación entre ambas variables. 


Los matemáticos y los físicos difieren, a veces, en cuanto al aspecto del con- 
cepto de función, al que conceden gran importancia. Generalmente, los primeros 
insisten en la ley de correspondencia, o sea, la operación matemática que ha de 
aplicarse a la variable independiente x para obtener el valor de la variable depen- 
diente u. En este sentido, f( ) es un símbolo que representa una operación mate- 
mática; el valor u = f(x) es el resultado de aplicar la operación f( ) al número x. 
Por otra parte, el físico se interesa generalmente por la cantidad u en sí, más que 
por el procedimiento matemático mediante el cual se obtiene a partir de x. La 
resistencia u que opone el aire a un cuerpo en movimiento depende de su veloci- 
dad v y puede determinarse experimentalmente, sea o no conocida una fórmula 
matemática explícita para calcular u = f(v). Lo que le interesa primordialmente 
al físico es la verdadera resistencia y no una fórmula matemática particular f(v), 
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excepto en cuanto el estudio de dicha fórmula contribuya a analizar el compor- 
tamiento de la cantidad u. Es ésta la actitud que se adopta generalmente cuando 
se aplica la matemática a la física o a la ingeniería. En cálculos más avanzados 
con funciones pueden evitarse muchas veces las confusiones estableciendo exacta- 
mente si se considera la operación f( ), mediante la cual sé asigna a x otra canti- 
dad u = f(x), o si interesa primordialmente u, que puede depender de manera 
enteramente distinta de otra variable z; p. ej., el área de un círculo viene dada 
por la función u = f(x) = rex?, siendo x el radio, y también por la función u = 
= g(2) = 22/47, donde z es la longitud de la circunferencia. 


Tal vez, el tipo más sencillo de función matemática de una varia- 
ble son los polinomios, de la forma: 


u = (1) = ao + az + ast? + +- + apar, 


con «coeficientes» constantes, do, 41, A2, ..., Un. Después vienen las 
funciones racionales, tales como 


1 Ng 1 2x + 1 
x “Sie e E TE 


que son cocientes de polinomios; y las funciones trigonométricas, sen x, 
cos x y tg x = sen x/cos x, para las cuales el método más cómodo de 
definición consiste en referirlas al círculo unidad ¿2 + yn? = 1, en el 
plano č, n. Si el punto P(É, y) se mueve sobre la circunferencia de este 
círculo y es x el ángulo que debe girar el semi-eje positivo E para que 
coincida con OP, entonces sen x y cos x son las coordenadas de 
P:cos z = č, sen t =y. 

2. Medida de los ángulos en radianes.—En la práctica, los ángulos 
se miden en unidades que se obtienen dividiendo un ángulo recto en 
un cierto número de partes iguales. Si son 90, la unidad es el «grado» 
sexagesimal. Para nuestro sistema decimal sería mejor dividir el án- 
gulo recto en 100 partes iguales, aunque equivaldría al mismo prin- 
cipio de medida. Sin embargo, para ciertos fines teóricos, es ventajoso 
utilizar un método esencialmente distinto para caracterizar la magni- 
tud de un ángulo y que se llama su «medida en radianes». Numerosas 
e importantes fórmulas, en las cuales aparecen las funciones trigono- 
métricas de un ángulo, adquieren una forma más sencilla con este 
sistema que si los ángulos se miden en grados. 

Para hallar la medida en radianes de un ángulo, describiremos una 
circunferencia de radio igual a 1 y centro en el vértice del ángulo. 
Éste determinará un arco s en la circunferencia, y definimos la lon- 
gitud de ese arco como la medida en radianes del ángulo. Puesto que 
la circunferencia completa de radio 1 tiene la longitud 2x, el ángulo 
de 360° tiene como medida 27 radianes. De aquí se deduce que si z 
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representa la medida en radianes de un ángulo, ẹ y su medida en 
grados, existe entre ambas la relación y/360 = 2/27; o sea, 


ny = 180x. 


Así, un ángulo de 90° (y=90) tiene una medida en radianes 
x = 907/180 = x/2, etc. Por otra parte, el ángulo de un radián (án- 
gulo cuya medida en radianes es z = 1) es el ángulo que subtiende 
un arco igual al radio del círculo. Expresado en grados, será igual a 
y = 180/r = 57,2957 ... °. Deberemos multiplicar siempre la medida 
en radianes x de un ángulo por el factor 180/x para obtener su me- 
«dida y en grados. ` 

La medida x de un ángulo en radianes es, por consiguiente, igual 
al doble del área A del sector del círculo unidad que determina ese 
ángulo, ya que la razón de dicha superficie a la total del círculo es 
igual a la del arco correspondiente a la longitud de la circunferencia: 
2/27 = Afr, x = 24. 

En lo que sigue, el ángulo x significará siempre aquel cuya medida 
en radianes es z. Un ángulo de x grados se escribirá siempre r°, para 
evitar ambigúedad. 

Es evidente que la medida en radianes es muy útil para las opera- 
ciones analíticas. Sin embargo, para los usos prácticos resulta incó- 
moda, Puesto que ~ es irracional, nunca podríamos volver al mismo 
punto de la circunferencia, si llevamos repetidas veces el ángulo uni- 
dad, es decir, aquel cuya medida en radianes es 1. La unidad usual 
es tal que, después de llevar 360 veces 1%, o cuatro veces 900, se vuelve 
al punto de partida. 

3. Gráfica de una función. Funciones inversas.—Muchas veces, 
una simple representación geométrica muestra claramente el carác- 
ter de una función. Si x, u, son coordenadas de un plano respecto a un 

` par de ejes perpendiculares, las funciones lineales, tales como u=ax +b, 
están representadas por líneas rectas; las funciones cuadráticas, tales 
como u = ax? + bx + c, por parábolas; la función u = 1/x, por una 
hipérbola, etc. Por definición, la gráfica de una función cualquiera 
u = f(x) se compone de todos los puntos del plano cuyas coordena- 
das z, u cumplen la condición u = f(x). Las funciones sen z, cos x, 
tg x, están representadas por las curvas de las figuras 151 y 152. Esas 
gráficas muestran claramente cómo aumentan o disminuyen los valo- 
res de la función al variar zx. 
- Un método importante para bdo nuevas funciones es el si- 
guiente: Comenzando por una función conocida F(X), intentemos 
resolver la ecuación U = F(X), respecto a X, de tal modo que X 
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FIG. 151. -- Gráficas de sen x y cos zq. 


aparezca como función de U: 
X = G(U) 


La función G(U) se llamará en- 
tonces una función inversa de 
F(X). Este procedimiento con- i 
duce a un resultado único sólo 
cuando la función U = F(X) 
define una representación bi- 
unívoca del dominio X en el 
U; es decir, si la desigualdad Fic. 152.—u = tg z. 
Xı Æ X2 entraña siempre esta 
otra: F(X1) + F(X2); pues sólo entonces quedará definida unívoca- 
mente una X para cada U. $ 

El caso antes visto, en el cual X significaba un triángulo cual- 
quiera del plano, y U = F(X) su perímetro, es un ejemplo oportuno. 
Es evidente que esta representación del conjunto de los triángulos S 
en el conjunto T de los números reales positivos no es biunívoca, ya 
que existen infinitos triángulos que tienen el mismo perímetro. Así, 
pues, en este caso la relación U = F(X) no sirve para definir una 
función inversa única. Por otra parte, la función m = 2n, donde n 
varía en todo el conjunto S de los números enteros y m en el con- 
junto T de los enteros pares, proporciona una correspondencia biuní- 
voca entre ambos conjuntos, y la función inversa n = m/2 está defi- 
nida univocamente. Otro ejemplo de una representación biunivoca lo 


proporciona la función 
u=xB, 


Al variar z en el conjunto de todos los números reales, u reco- 
rrerá el mismo dominio, tomando cada valor una vez y sólo una. La 
función inversa, definida unívocamente, es 


3/-— 
X = u. 
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En el caso de la función 
u = e, 


la función inversa no está determinada unívocamente. Puesto que 
u = 22 = (—x)?, a cada valor positivo de u corresponderán dos de z. 
Pero si, como es costumbre, se conviene que el símbolo yu repre- 
sente el número positivo cuyo cuadrado es u, la función inversa 


:=Vu 


existe, siempre que limitemos la variación de x y de u a valores positivos. 

Observando la gráfica de una función u = f(x) de una variable, 

puede deducirse de una ojeada la existencia de una función inversa 

única. Ésta estará unívocamente definida, si a cada valor de u corres- 

3 ponde otro de x y uno solo. En la gráfica, 

esto significa que ninguna paralela al eje x 

corta a la curva en más de un punto, lo 

que ocurrirá ciertamente si la función 

u = f(x) es monótona; es decir, si aumenta 

o disminuye constantemente al aumentar x; 

F o p. ej., si u = f(x) es monótona creciente, 

para zı < qz se tendrá siempre u, = f(x1)< 

< uz = f(x2). De aquí se deduce que para 

un cierto valor de u puede existir a lo más 

un z, tal que u = f(x), con lo que la fun- 

ción inversa quedará definida unívoca- 

Fic. 153.—u = 43, mente. La gráfica de la función inversa 

x = g(u) se obtiene simplemente haciendo 

girar el dibujo primitivo un ángulo de 180% alrededor de la bisectriz 

del primer cuadrante (Fig. 154), con lo cual se cambian entre sí las 

posiciones de los ejes x y u. La nueva posición de la curva muestra x 

como función de u. En la posición original de la gráfica, u aparece 

como la altura por encima del eje horizontal x, mientras que, después 

de la rotación, la misma curva muestra x como altura sobre el eje 

horizontal u. 

Las observaciones del párrafo anterior pueden aclararse conside- 

rando el caso de la función 


u=t 


u = tg r. 


Esta función es monótona para —r/2 < x < 1/2 (Fig. 152). Los 
valores de u, que crecen monótonamente con x, varían desde — oo 
a +00, por lo que la función inversa 


x = gu). 
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FiG. 154. — Funciones inversas. 


está definida para todo valor de u. Se designa por tg-lu, o bien 
por arc tg u. Así, arc tg 1 = x/4, ya que tg r/4 = 1. La figura 155 
muestra esta función, 


Fre. 155.—x = arc tg u. 


4. Funciones compuestas.—Otro método para crear nuevas fun- 
ciones, partiendo de dos o más previamente dadas, consiste en for- 
mar funciones compuestas; p. ej., la función 


u= = VI+ 
se «compone» de estas dos más sencillas: 
z = g(x) = 1 + a, u= hz) = Vz, 


y puede escribirse de la manera siguiente: 


u = f(x) = hkg[x]) (léase «h de g de zre). 


Análogamente, la función 


u = H =1/ V1- r 
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está compuesta por las tres funciones: 


as 1 
z = g(x) = 1 — e2, w = hz) = Y z. u = kw) = -7 


por lo que resulta: 
u = f(x) = k(h[9(x))). 
La función 


1 
u = f(x) = sen — 
zr 
se compone de las dos funciones siguientes: 
1 
z = g(z) Y u= hz) = senz. 


La función f(x) no está definida para x = 0, puesto que para este valor la 
expresión Yz no tiene significado. La gráfica 'e esta función notable se obtiene 
de la del seno. Sabemos que sen z = 0 para z = kr, donde k es cualquier entero 
positivo o negativo. Además, 


T 
1 para 7 =(4k + 1) -> 
sen z = 
T 
—1 para 2=(4k — DI? 


siendo k un entero cualquiera. De donde se deduce: 


1 
0 para t=-=—, 


kr 
1 2 
sn =4 1 para r= Tik 4 DO 
—1 para z= > 
(4k — 1)re 


Si damos sucesivamente a k los valores k = 1, 2, 3, 4,** -, como los denomi- 
nadores de estas fracciones aumentan indefinidamente, los valores de x para los 
que la función sen (1/x) es igual a 1, —1, 0, se acumularán cada vez más en torno 
al punto x = 0. Entre uno de esos puntos y el origen existirá además un número 
infinito de oscilaciones de la función, cuya gráfica aparece en la figura 156. 


5. Continuidad.—Las gráficas de las funciones que hemos conside- 
rado hasta ahora proporcionan una idea intuitiva del concepto de 
continuidad. En una sección posterior analizaremos con toda preci- 
sión este concepto, después de haber establecido de forma rigurosa 
el de límite. Hablando en términos generales, diremos que una fun- 
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Fi. 156.—u = sen E 
z 


ción es continua cuando la gráfica es una curva sin interrupción 
(véase pág. 321). Puede estudiarse la continuidad de una función dada, 
u = f(x), haciendo que la variable independiente v se aproxime inde- 


finidamente, por la derecha y 
por la izquierda, hacia un valor 
prefijado zı. A menos que la 
función u = f(x) sea constante 
en el entorno de x,, su valor 
cambiará. Si el valor de f(x) 
tiende al de f(x1), es decir, al 
valor de la función en el punto 
prefijado x = x,, cualquiera que 
sea la forma como tienda x a Xi, 
por un lado o por el otro, se 
dice que la función es continua 
en el punto. zı. Si esto es cierto 
para todo punto x de un cierto 
intervalo, se dice que la función 
es continua en el intervalo. 
Aunque toda función que 
esté representada por una curva 


u 


Fic. 157. —Discontinuidad finita. 


sin interrupciones es continua, es' fácil definir funciones que no son 
continuas en todo punto; p. ej., la función de la figura 157, definida 
para todo valor de x, mediante el convenio 


()=1+x 


para x>0 


Kz)= —1 +z para 2<0 
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es discontinua en el punto xı = 0, donde toma el valor —1. Si inten- 
tamos dibujar una gráfica de la función, tendremos que levantar el 
lápiz del papel en este punto. Si nos acercamos al valor xı = 0 desde 
la derecha, f(x) tiende a +1, que difiere del verdadero valor en ese 
punto. No basta, para establecer la continuidad, el hecho de que al 
tender x a 0, por la izquierda, f(x) tienda a —1. 

La función f(x) definida para todo x por el convenio 


(2) =0 para 20,  [(0)=1, 


presenta una discontinuidad de distinto tipo en el punto xı = 0. Aquí, 
al tender x a 0, existen ambos límites, tanto por la izquierda como por 
la derecha, y son iguales; pero este límite común no coincide con f(0). 

Otro tipo de discontinuidad es el que ofrece la función de la figu- 
ra 158 


1 
u = f(x) = > 


en el punto z = 0. Si se hace tender x a cero, sea por la derecha o 
por la izquierda, u tiende a infinito; la gráfica de la función se inte- 
rrumpe en este punto, y peque- 
ñas variaciones de z en el en- 
torno de x = 0 pueden produ- 
cir cambios muy grandes en u. 
En sentido estricto, el valor de 
la función no está definido para 
x = 0, ya que infinito no es un 
número y, en consecuencia, no 
podemos decir que f(x) sea infi- 
nita para x = 0. Por tanto, nos 


0 limitamos a decir que f(x) «tien- 
de a infinito» al tender x a cero. 
Ft6. 158. — Discontinuidad infinita. ‘Un tipo distinto de discon- 


tinuidad aparece en la función 

u = sen (1/x), en el punto x = 0, como resulta evidente de la gráfica 
de la función (Fig. 156). 

Los ejemplos precedentes ponen de manifiesto las diversas formas 

en que puede dejar de ser continua una función en un punto x = 21: 

1) Es posible a veces conseguir que la función sea continua en 

x = Tı, mediante una definición adecuada de su valor para t = tj; 

p. ej., la función u = x/x es constantemente igual a 1 si x 40; no 

está, en cambio, definida para x = 0, porque 0/0 es un símbolo ca- 
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rente de significado. Pero si convenimos en este caso que el valor 
u = 1 corresponde también al valor x = 0, la función así generali- 
zada resulta continua para todo valor de x, sin excepción. El mismo 
efecto se consigue si definimos f(0) = O para la función que hemos 
considerado anteriormente. Una discontinuidad de este tipo se dice 
que es evitable. 

2) Pueden existir límites distintos cuando zx tiende a zı, según lo 
haga por la derecha o por la izquierda, como se ve en la figura 157. 

3) Es también posible que no existan estos límites laterales, como 
ocurre en la figura 156, 

4) La función puede tender a infinito al tender x a zı, como en 
el caso de la figura 158. 

Las discontinuidades de los últimos tres tipos se dice que son 
esenciales; no pueden evitarse por una adecuada o nueva definición 
de la función en el punto x = 2). 


Ejercicios: 
1. Represéntense las funciones 
z—1 x*-1 x 
x? ’' x? 4 1° (z2 — 1)(22 + 1) 
y determínense sus discontinuidades. 
2. Dibújense las funciones x sen (1/x) y zè sen (1/x) y verifíquese su conti- 
nuidad para x = 0, si se define en ambos casos u = 0 para x = 0. 


*3. Demuéstrese que la función arc tg (1/x) tiene una discontinuidad del 
segundo tipo (salto), para x = 0. 


*6. Funciones de varias variables. —Volvamos a nuestra discusión 
sistemática del concepto de función. Si la variable independiente P 
es un punto del plano, de coordenadas x e y, y si a cada punto P co- 
rresponde un número único u, que puede ser, p. ej., la distancia del 
punto P al origen, escribiremos en general 


u = [(x, y). 


Se utiliza también esta notación si, como a menudo sucede, las 
dos cantidades x e y aparecen desde un principio como variables inde- 
pendientes; p. ej., la presión u de un gas es función del volumen zx 
y de la temperatura y, y el área de un triángulo es una función 
u = f(x, y, z) de las longitudes x, y, z de sus tres lados. 

Así como una gráfica nos da la representación geométrica de una 
función de una variable, una superficie en un espacio de tres dimen- 
siones, de coordenadas zx, y, u, permite la representación geométrica 
de una función u = f(x, y) de dos variables. Asignamos a cada punto 
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Fic. 160. — Paraboloide hiperbólico. 


EST 


Fic. 161.— Una superficie u = f(x, y). Fic. 162. —Curvas de nivel correspondientes. 





z, y del plano otro punto del espacio, cuyas coordenadas son 2, y y 

u = f(x, y). Así, la función u = y 1 — 22 — y? está representada por 

una superficie esférica, de ecuación u? + z? + y? = 1; la función li- 

neal u = ax + by + c está representada 

v por un plano, y la función u = xy, por un 
paraboloide hiperbólico, etc. 

Puede darse una representación dis- 
tinta de la función u = f(x, y) sin salir 
del plano x, y, mediante curvas de nivel. 
En lugar de considerar el «panorama» tri- 
dimensional u = f(x, y), dibujamos, como 
en un mapa altimétrico, las curvas de 
nivel de la función, representando las pro- 
yecciones de todos los puntos de igual 
cota u sobre el plano x, y. Estas curvas 


Fro. 165. Curvas de nivel de nivel son simplemente las curvas 
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Hx, y) = c, en las cuales c permanece constante para cada curva. Así, 
la función u = x + y queda caracterizada por la figura 163. Las cur- 
vas de nivel de una superficie esférica son una familia de circunferen- 
cias concéntricas. La función u = x2 + y2, que representa un para- 
boloide de revolución, está caracterizada, -análogamente, por un sis- 
tema de circunferencias (Fig. 165). Por medio de números adscritos 
a las diferentes curvas puede indicarse su cota, u = C, 

En física aparecen funciones de varias variables al pretender des- 
cribir el movimiento de un medio continuo; p. ej., si ina cuerda 
tensa entre dos puntos del eje de las x se deforma de tal modo que la 
partícula que ocupa el punto x se desplaza perpendicularmente al eje 


u 
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Fic. 164. — Paraboloide de FiG. 165.—Curvas de nivel 
revolución. correspondientes. 


una cierta distancia, y se la suelta después, vibrará de tal manera 
que la partícula cuya abscisa inicial era xr, se encontrará en el instante t 
a una distancia del eje x igual a u = f(x, t). El movimiento. queda 
completamente descrito en cuanto se conoce la función u = f(x, t). 

Es posible aplicar a las funciones de varias variables la definición 
de continuidad dada para las de una sola variable. Se dice que una 
función u = f(x, y) es continua en el punto x = ti, Y = Yi si f(x, y) 
tiende a f(x1, y1) cuando él punto zx, y tiende al xı, yı, en cualquier 
forma y desde cualquier dirección. 

Existe, sin embargo, una diferencia importante entre las funciones 
de una y de varias variables. En este último caso, el concepto de fun- 
ción inversa carece de significado, pues es imposible resolver una ecua- 
ción u = f(x, y); p. èj u =x + y, de tal manera que cada una de 
las cantidades independientes x e y aparezca expresada en función de 
una sola cantidad u. Pero esta diferencia en el aspecto de las funcio- 
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nes de una y de varias variables desaparece si vemos en el concepto 
de función la idea de una representación o transformación. 

*7. Funciones y transformaciones. —Una correspondencia entre los 
puntos de una recta l, caracterizados por su abscisa x, y los puntos 
de otra recta l’, determinados por su abscisa x', es simplemente una 
función x' = f(x). Si esa correspondencia es biunívoca, tendremos 
también lå función inversa x = g(x’). El ejemplo más sencillo es el 
de una transformación por proyección, que, en general, se caracteri- 
za (lo afirmamos sin demostración) por una función de la forma 
x' = f(x) = (ax + b)/(cx + d), donde a, b, c y d son constantes. En 
este caso, la función inversa es z = g(x’) = (—dx' + b)/(ca' — a), 

Las representaciones en dos dimensiones de un plano x, de coor- 
denadas x e y, sobre otro plano x’ de coordenadas x' e y”, no pueden 
expresarse por una sola función x' = f(x), sino que se requieren dos 
funciones de dos variables: 





x = f(x, y), y” = glx, y). 


P. ej., una transformación proyectiva está dada por el sistema de 
funciones 
Y= ax + by +c 
gz + hy +k' 
, d+ ey+! 
gr yk 


donde a, b, ..., k, son constantes, y x, y, x’, y’, son las coordenadas 
de ambos planos, respectivamente. Desde este punto de vista, la idea 
de una- transformación inversa adquiere perfecto sentido. Simplemen- 
te, debemos resolver este sistema de ecuaciones, considerando x e y 
como incógnitas, en función de x' e y’. Geométricamente, esto equi- 
vale a encontrar la transformación inversa de x’ en z. Estará definida 
unívocamente si la correspondencia entre los puntos de ambos pla- 
nos ès unívoca. ; 

Las transformaciones del plano estudiadas en topología no están 
dadas por simples ecuaciones algebraicas, sino por un sistema cual- 
quiera de funciones, 

x = f(z, y) Y = ghz, y), 


que definen una transformación biunívoca y bicontinua. 


Ejercicios: 

*1. Demuéstrese que la transformación por inversión (Cap. III, pág. 154) en el 
círculo unidad está dada analiticamente por las ecuaciones z’ = x2/(1? + y?), 
y’ = y/(a3 + y2). Determínese la transformación inversa. Demuéstrese, analítica- 
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mente, que la inversión transforma la totalidad de rectas y circunferencias en 
rectas y circunferencias. 

2. Demuéstrese que mediante la transformación x’ = (ax + b)/(cx + d) cua- 
tro puntos del eje x se transforman en otros cuatro del eje x’, con la misma razón 
doble (véase pág. 187). 


IL. LÍMITES 


1. Límite de una sucesión an.—Como ya hemos visto, el concepto 
de continuidad de una función se basa sobre el de límite. Hasta ahora 
hemos utilizado dicho concepto en una forma más o menos intuitiva. 
En este párrafo y los siguientes lo consideraremos de una manera 
más sistemática, comenzando por el estudio de las sucesiones, que 
son más sencillas que las funciones de una variable continua. 

En el capítulo II encontramos ya sucesiones de números an y 
estudiamos sus límites, al crecer n indefinidamente o «tender a infi-. 
nito»; p. ej., la sucesión, cuyo término enésimo es an = 1/n, 





1 1 1 


1, —, A. — +." 
ES n 


11] 
tiene el límite 0 al crecer n, es decir, 


1 
elsa O cuando n= 00 12] 


Intentemos formular exactamente lo que se quiere decir con eso; 
al avanzar en la sucesión, los términos resultan cada vez menores. 
Después del término de lugar cien, todos son menores que 1/100; des- 
pués del de lugar mil, menores que 1/1000, etc. Ninguno de ellos es 
efectivamente igual a cero; pero si avanzamos suficientemente: èn la 
sucesión, podemos estar seguros de que todos los términos difieren 
de 0 tan poco como queramos. i 

La única dificultad en esta explicación consiste en que no es com- 
pletamente claro el significado de las frases en cursiva. ¿Hasta dónde 
debemos ir para «avanzar suficientemente», y cuánto es «tan poco 
como queramos»? Si podemos dar un sentido preciso a estas frases, 
tendrá también un significado preciso la relación [2]. 

Una interpretación geométrica nos ayudará a aclarar más la cues- . 
tión. Si representamos los términos de la sucesión [1] por sus corres- 
pondientes puntos sobre una recta, observamos que éstos parecen 
acumularse alrededor del punto: O. Elijamos un intervalo I de cen- 
tro en el punto O y de amplitud 2s, de tal modo que se extienda una 
distancia e a cada lado del punto O. Si elegimos e = 10, natural- 
mente todos los términos a, = 1/n de la sucesión quedarán dentro 
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de I. Si e = 1/10, salvo los 10 primeros términos, todos ellos, a par- 
tir del au, es decir, 


1/11, 1/12, 1/13, 1/14, >, 


quedarán dentro de 1. Y si tomamos s = 1/1000, sólo los primeros 
mil términos de la sucesión quedarán fuera de 7, mientras que a par- 
tir del ajoo1, todos los infinitos términos 


41001, 41002, 01003, * ** 


serán interiores a /. Es evidente que este razonamiento es válido 
cualquiera que sea el número positivo e; una vez elegido éste, por 
muy pequeño que sea, podemos encontrar un entero N lo bastante 
grande que 

1/N< e. 


De aquí se deduce que todos los términos an de la sucesión, para 
los cuales n > N serán interiores a J y que sólo un número finito de 
ellos, a1, dz, a3, ... an-ı, quedará fuera. El punto importante es éste: 
primeramente, se asigna al intervalo 7 una amplitud arbitraria me- 
diante la elección de e; después, puede encontrarse un entero conve- 
niente N. Este proceso de elegir primero un número e y encontrar 
después un entero conveniente N puede efectuarse cualquiera que sea 
el número positivo e, por pequeño que se haya tomado, lo que pro- 
porciona un significado preciso a la afirmación de que todos los tér- 
minos de la sucesión (1] difieren de O tan poco como se quiera, siem- 
pre que se avance suficientemente en la misma. l 

Resumiendo: sea e un número positivo cualquiera; entonces, po- 
demos encontrar un entero N, tal que todos los términos an de la 
sucesión [1], para:los cuales n > N son interiores a un intervalo Į de 
amplitud total 2e y cuyo centro es el punto O. Éste es el significado 
preciso de la relación [2]. 

Basándonos en este ejemplo, podemos dar ahora una definición ri- 
gurosa de la afirmación general: «la sucesión de números reales aj, a2, 
a3, ..., tiene el límite a». Incluimos a en el interior de un intervalo I 
de la recta numérica: si el intervalo es pequeño, algunos de los núme- 
ros dp quedarán fuera de él; pero apenas sea n suficientemente gran- 
de, p. ej., igual o mayor que un cierto entero N, todos los números an, 
para los cuales n > N, serán interiores al intervalo. Naturalmente, 
es necesario tomar N muy grande, si es muy pequeño el intervalo 
elegido 1; pero cualquiera que sea su amplitud, debe existir un en- 
tero N si la sucesión ha de tener como límite a. 
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Se expresa simbólicamente que una sucesión an tiene el límite a 
de la siguiente manera: 


lim an = a, cuando n>o00, 


o simplemente 
4g> a, cuando n> 00 


(léase: an tiende a a, o converge hacia-a). 

Puede formularse de forma más concisa la definición de convergen- 
cia de una sucesión an hacia un límite a, de la manera siguiente: La 
sucesión ai, a2, az, ..., tiene el límite a, cuando n tiende a infinito, si 
para todo número positivo e, por pequeño que sea, existe un entero N 
(que depende de z), tal que 


Ja—an|<e paratodo n >N. [3] 


Ésta es la formulación abstracta del concepto de límite de una 
sucesión. No es de extrañar que cuando se encuentra por primera vez 
no sea posible captarla inmediatamente en toda su profundidad. Al- 
gunos autores adoptan una actitud poco feliz, presentando esta defi- 
nición al lector sin una preparación adecuada, como si dar una expli- 
cación no resultara muy honroso para la dignidad de un matemático. 

La definición sugiere la siguiente disputa entre dos personas A y B. 
A exige -que los an se acerquen a la cantidad fijada a con una apro- 
ximación mayor que un cierto margen e = ey. B prueba que satisface 
esa exigencia demostrando que existe un número entero N = N; tal 
que todos los an posteriores al elemento ay, cumplen esa condición. 
Entonces A se hace más exigente y propone un nuevo margen e = ez, 
más pequeño. B accede de nuevo a su demanda encontrando otro 
entero N = Na (tal vez mucho mayor):-Si B puede satisfacer siempre 
a A, por pequeño que sea el margen que ésta imponga, se produce la si- 
tuación que hemos expresado mediante an > a. 

Existe una dificultad psicológica auténtica para comprender esta 
definición precisa de límite. Nuestra intuición nos sugiere una idea 
«dinámica» del límite, como si fuera el resultado de un «movimiento»: 
recorremos la sucesión de enteros 1, 2, 3, ..., N, ..., y Observamos el 
comportamiento de la sucesión an. Sentimos que debe ser posible 
observar la convergencia an > a; pero es imposible dar una formula- 
ción matemática clara de esta actitud «natural». Para llegar a una 
definición precisa, tenemos que invertir el orden del proceso; en lugar 
de observar primero la variable independiente n y después la depen- 
diente an, debemos basar nuestra definición en lo que es necesario 
hacer si queremos verificar la afirmación según la cual an >a. Para 


304 FUNCIONES Y LÍMITES [cap. 6 


proceder de esa manera, debemos elegir primeramente una distancia 

arbitrariamente pequeña en torno de a, y determinar si podemos sa- 

tisfacer esa condición eligiendo un valor suficientemente grande de 

la variable independiente n. Dando después denominaciones simbóli- 

cas, e y N, a las palabras «arbitrariamente pequeño» y «n suficien- 

temente grande», llegamos a la definición precisa de límite. 
Consideremos como nuevo ejemplo la sucesión 


1 2 3 4 n 
2? 3?4?’ 5” "n+1” i 


en la cual, an = n/(n + 1). Digo que el límite es 1. Si el lector elige 
un intervalo cuyo centro sea el punto 1 y para el cual e = 1/10, 
puedo satisfacer su exigencia [3] tomando N = 10, pues 


en cuanto n > 10. Si el lector se hace más exigente y elige e = 1/1000, 
puedo satisfacer esa demanda tomando N = 1000, y análogamente, 
para cualquier número positivo e, por pequeño que sea, pues me bas- 
tará elegir un entero N mayor que 1/e. Este proceso de asignar una 
distancia arbitrariamente pequeña e alrededor del número a y de- 
mostrar después que los términos de la sucesión an están todos den- 
tro de una distancia e de a, si avanzamos en ella suficientemente, es 
la descripción minuciosa del hecho de que lím an = a. 

Si los términos de la sucesión as, da, as, ... , se expresan en forma 
decimal, la afirmación lím an = a significa simplemente que para 
cualquier entero positivo m, las primeras m cifras de an coinciden 
con las m primeras del desarrollo decimal del número fijo a, con tal 
que se tome n suficientemente grande; p. ej., mayor o igual que un 
cierto entero N (que depende de m). Esto corresponde simplemente 
a elegir e en la forma 10-™. 

Existe otro método muy sugestivo de expresar el concepto de lími- 
te. Si lim an = a, y encerramos a en el interior de un intervalo Z, en- 
tonces, por pequeño que sea /, todos los números an, para los cuales 
n es igual o mayor que un entero N, se encontrarán dentro de 1, por 
lo que, contando desde el principio de la sucesión, a lo sumo un nú- 
mero: finito, N — 1, de términos 


Ay, Ag, ***, AN-1, 


pueden estar fuera de I. Si I es muy pequeño, N será muy grande, 
p. ej., cien o mil millones, pero siempre quedará fuera de 7 sólo un 
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número finito de términos, mientras que los infinitos restantes serán 
interiores a I. 

Podemos decir que casi todos los términos de una cierta sucesión 
tienen una determinada propiedad si sólo un número finito de ellos, 
no importa lo grande que sea, no la poseen; p. ej., «casi todos» los 
enteros positivos son mayores que 1 000 000 000 000. Utilizando esta 
terminología, la afirmación lím an = a equivale a decir que si I es un 
intervalo cualquiera cuyo centro es a, casi todos los números an se en- 
cuentran dentro de 1. 

Conviene observar de pasada que no debe suponerse que todos los 
términos ay de la sucesión han de tener necesariamente valores distin- 
tos. Es posible que algunos, infinitos, o incluso fodos ellos, sean igua- 
les al valor límite a; p. ej., la sucesión az = 0, az =0, ..., a n=0, ... 
es perfectamente legítima y, naturalmente, su límite es cero. 

Una sucesión an que tiene un límite a se llama convergente. Una 
sucesión an que carece de límite se llama divergente. 


Ejercicios: Demuéstrese: 

1. La sucesión an = n/(ni + 1) tiene límite 0. (Indicación: an = 1/(n + 1/n) 
es menor que 1/n y mayor -que 0.) 

2. La sucesión an = (n? + 1)/(n3 + 1) tiene el límite O. (Indicación: an = 
=(1 + 1/n3)/(n + 1/n2) está comprendido entre 0 y 2/n.) 


3. La sucesión 1, 2, 3, 4, --- y las sucesiones oscilantes 
1, 2,1,2, >, 
1, —1, 1, —1, *** es decir, an = (—1)}, 


1, 1/2, 1, 1/3, 1, 1/4, 1, 1/5, -*-, 
no tienen límite. 


Si en una sucesión an los términos llegan a ser mayores que cual- 
quier número prefijado K, diremos que an tiende a infinito y escribi- 
remos: lím an = 00, O an —> œ0; p. ej., n? —> œo y 22 —> oo. Esta ter- 
minología es útil, aunque quizá no del todo satisfactoria, puesto que 
no puede considerarse oo como un número a. Una sucesión que tiende 
a infinito se llama también divergente. 


n+1 n +i 
Ejercicios: Demuéstrese que las sucesiones an = PEs , an = BR 


n nti’ 





ns — 1 na 


E ET 


tienden todas a infinito. 

A veces, los principiantes cometen el error de creer que un paso 
al límite, cuando n > co, se lleva a cabo simplemente sustituyendo 
n por co en la expresión de an; p. ej., 1/n > 0, puesto que «1/00 = 0», 
Pero el símbolo co no es un número, y su utilización en la expresión 
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1/00 es ilegítima. Imaginarse el límite de una sucesión como si fuera 
el «último» término an, cuando n = oo, significa desconocer el verda- 
dero sentido del concepto y oscurece sus consecuencias. 

2. Sucesiones monótonas.—En la: definición general dada en la 
página 303 no se exigió una forma determinada para que la sucesión 
a1, A3, ds, ..., tendiera a su límite, El ejemplo más sencillo es el de las 
sucesiones que se llaman monótonas, tales como 


1/2, 2/3, 3/4, <>, n(n +1) ++ >. 
Cada término de esta sucesión es mayor que el precedente, pues 
n+1 1 1 n 


aupa 1 “h2? 1 RA al = ün. Se denomi- 


nan monótonas crecientes las sucesiones de este tipo para las cuales 
An+1 > An. Análogamente, una sucesión para la cual an > dn+1 COMO, 
p. ej., 1, 1/2, 1/3, ..., se lama monótona decreciente. Las sucesiones de 
este tipo se aproximan a su límite exclusivamente desde un lado; en 
contraste con ello, existen sucesiones que oscilan tal como: —1, +1/2, 
—1/3, +1/4, ..., que se aproxima a su límite O desde ambos lados 
(véase Fig. 11). 

Es fácil determinar el comportamiento de una sucesión monótona; 
puede carecer de límite y exceder a cualquier número, como, p. ej., 


1,2,3,4,-»*, 
en la cual an = n, o la sucesión 
2,3,5,7,11,13,--*, 


donde an es el n-ésimo número primo, pn. 

En este caso la sucesión tiende a infinito; pero si los términos de 
una sucesión monótona creciente están acotados; es decir, si todo tér- 
mino es menor que una cota superior B, conocida de antemano, re- 
sulta intuitivo que debe tender a un cierto límite a, que será menor, 


a a 8 3 A 


1 2 3 
Fra. 166. — Sucesión monótona acotada. 


o a lo sumo igual a B. Esta proposición, que llamaremos principio 
de las sucesiones monótonas, se enuncia así: Toda sucesión monótona 
creciente, que está acotada superiormente, tiene limite. (Puede hacerse 
una afirmación análoga para una sucesión monótona decreciente, que 
esté acotada inferiormente.) Es notable que no haga falta conocer 
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previamente el valor del límite a; el teorema afirma que, si se cumplen 
las condiciones impuestas, tal límite existe. Naturalmente, este teo- 
rema depende de la introducción de los números irracionales, pues de 
otra manera no sería siempre cierto. Como ya hemos visto en el capí- 
tulo II, cualquier número irracional (p. ej., y2) es límite de una 
sucesión monótona creciente y acotada de fracciones racionales deci- 
males, cuyos términos se obtienen tomando las n primeras cifras de 
una fracción decimal de infinitas cifras. 


*Aunque el principio de las sucesiones monótonas resulta evidente a la intui- 
ción, es instructivo dar una demostración rigurosa del mismo. Vamos a ver que 
dicho principio es una consecuencia lógica de las definiciones de número real y 
de límite. 

Supongamos que los números 4, a2, a3, ... forman una sucesión creciente, pero 
acotada. Podemos expresarlos en forma de fracciones decimales de infinitas cifras. 


41 = Ay, pipeP3**, 
da = As, q19e93 ***, 
da = Ag, fala **, 


e. .e.oooas.s$< $s»ss..». 


donde los A; representan números enteros y los pi, qi, étc., son cifras de 0 a 9. 
Puesto que la sucesión a, az, az... está acotada, estos enteros no pueden crecer 
indefinidamente, y como la sucesión es monótona creciente la sucesión de los ente- 
ros Ai, Az, Ag: *, permanecerá constante después de alcanzar su valor máximo. 
Sea A dicho máximo y supongamos que lo alcance en la No-ésima fila. Recorra- 
mos ahora la segunda columna pı, 91, rı, * ** , limitando nuestra atención a los 
términos de la No-ésima fila y las siguientes. Si x; es la mayor cifra que aparece 
en esta columna después de la No-ésima fila, x aparecerá reiteradamente «después 
de su primera aparición, lo que puede ocurrir en la Ny-ésima fila, siendo Ni > No, 
pues si las cifras de esta columna disminuyeran después de esta fila, la sucesión a, 
42, a3, * **, no sería monótona creciente. Consideremos ahora las cifras p2, q2, Fa,***>, 
de la tercera columna. Un razonamiento análogo demuestra que después de un 
cierto entero Na > Ni, las cifras de la tercera columna son constantemente igua- 
les a rz. Repitiendo este proceso para las 4.3, 5,8, - - -, columnas, obtenemos los 
dígitos z3, Ta, Ts * * * y Una sucesión correspondiente de números enteros Ng, Na, 
N5, * + * Es fácil ver que el número 


a = A, XiLal3ta > 


es el límite de la sucesión a1, az, az... Pues si se elige un e > 10-m, para todos los 
n > Nm, la parte entera y las m primeras cifras después de la coma de am coinci- 
dirán con las de a, por lo que la diferencia | a — an | no puede exceder a 10-15, 
Puesto que es posible lograr esto para cualquier e positivo, por pequeño que sea, 
ya que bastará tomar m suficientemente grande, el teorema queda demostrado. 

Se llega a este mismo resultado basándonos en cualquiera de las otras defi- 
niciones de número real, dadas en el capítulo II; p. ej., mediante los encajes de 
intervalos o las cortaduras de Dedekind. Estas demostraciones pueden encontrarse 
en cualquier tratado de análisis matemático. 
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Este principio de las sucesiones monótonas podía haberse utilizado en el capí- 
tulo 11 para definir la suma y el producto de dos números con infinitas cifras 
decimales: 

a = A, ajaga:.', 
b = B, bibabs -+> 


Es imposible sumar o multiplicar dos expresiones de ese tipo de la manera 
corriente, es decir, empezando por la última cifra decimal de la derecha, pues no 
existe tal última cifra. (Como ejemplo, el lector puede intentar sumar los dos nú- 
meros decimales 0,333333 - -- y 0,989898 - - -), Pero si £n representa la fracción deci- 
mal finita, obtenida tomando n cifras decimales en a y b, y sumando de la ma- 
nera ordinaria, la sucesión X1, £s, x3, *  * será monótona creciente y estará acotada 
(p. ej., por el entero A + B + 2). De ahí que esta sucesión tenga límite y pode- 
mos definir a + b = lím Ta. Un método análogo sirve para definir el producto ab, 
Mediante las leyes de cálculo de la aritmética es posible extender estas definicio- 
nes hasta abarcar todos los casos, cualesquiera que sean los signos de a y b. 

Ejercicio: Demuéstrese de esta manera que la suma de los dos números con- 
siderados antes es 1,323232 --- = 131/99. 


La importancia del concepto de límite en matemática reside en 
que muchos números se definen exclusivamente mediante límites, a me- 
nudo como Jímites de sucesiones monótonas acotadas. Por esta razón, 
el campo de los números racionales, en el cual dichos límites pue- 
den no existir, resulta demasiado restringido para las necesidades de 
la matemática. 

3. El número «e» de Euler.—El número e ocupa un lugar destacado 
en la matemática, junto con el número tr de Arquímedes, desde la 
publicación, en 1748, de la obra de Euler Introductio in Analysin 
Infinitorum. Proporciona un excelente ejemplo del modo en que el 
principio de las sucesiones monótonas puede servir para definir un 
nuevo número real. Utilizando el simbolo 


n =1:2:3:4--+-n 
para el producto de los n primeros números enteros, estudiemos la 


sucesión a, 42, ag, en la cual 


E y 1 i 
=t + atatt a 14] 


Los términos an forman una sucesión monótona creciente, puesto 
que se obtiene an}; sumando a an una cantidad positiva 1/(n + 1)!. 
Además, los números an están acotados superiormente: 


an < B = 3, [5] 
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pues se tiene: 


de donde resulta: 


1 1 1 1 
a at rl ie ra 


=1 421 — (1/23) < 3, 


utilizando la fórmula dada en la página 20 para la suma de los n 
primeros términos de una progresión geométrica. De acuerdo con el 
principio de las sucesiones monótonas, cuando n tiende a oo, an debe 
tender a un límite, y a este limite lo llamaremos e. Para expresar que 
e = lím an, podemos escribir e en forma de serie: 

-1 


1 1 
+a ta te t e [6] 


1 
es1+ +3 +3 nl 


1! 
Esta «igualdad», que incluye una sucesión de puntos suspensivos, es 
simplemente otro método de expresar las dos afirmaciones siguientes: 
1 
+ +A 


1 1 
o 


“m=i ta 


< 


an= e cuando n> œ. 


La serie [6] permite calcular e con la aproximación que se desee; 
p. ej., la suma (con ocho cifras decimales) de los términos de [6] 
hasta 1/12! inclusive es X = 2,71828183... (El lector debe verificar 
este resultado.) Es fácil estimar el «error»; esto es, la diferencia entre 
ese valor y el verdadero de e. Para la diferencia (e — 2) tenemos la 
expresión 


Esta diferencia es tan pequeña que no puede afectar a la octava 
cifra decimal de X. Suponiendo que exista un posible error en la última 
cifra del valor dado más arriba, tenemos e = 2,7182818, con siete ci- 
fras decimales exactas. 
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*El número e es irracional. — Para demostrarlo procederemos indirectamente, 
suponiendo que fuera e = p/q, donde p y q son enteros, y viendo que esta hipó- 
tesis conduce a un absurdo. Puesto que sabemos que 2 < e < 3, e no puede ser 
entero, por lo que q debe ser, por lo menos, igual a 2. Multiplicando ambos miem- 
bros de [6] por q! = 2 + 3 - - - q, se tiene 


esq=p:2:3:**(q—-1)= [q +g1+3:4:--:-q4+4:5:::q+ 
1 


1 
arotarnarat M 


+ +a iW tati] + 


Evidentemente, el primer miembro es un número entero; en el segundo miem- 
bro, la expresión entre corchetes lo es igualmente; pero los restantes términos tie- 
nen suma positiva menor que 1/3, por lo que no pueden componer un entero, ya 
que g > 2 y los términos de la serie 1/(q + 1) + >+ son menores que los corres- 
pondientes de la serie geométrica ‘1/3 + 1/32 + 1/33 - - - , cuya suma es 1/2. De 
aquí se deduce que [7] entraña una contradicción: el entero del primer miembro 
no puede ser igual al valor del segundo, pues éste no es un entero, por cuanto se 
compone de un entero y de un número positivo menor que 1/2. 


4. El número .—Como se sabe desde el bachillerato, la longitud 
de la circunferencia de radio 1 puede definirse como el límite de la 
sucesión de los perímetros de polígonos regu- 
lares de un número creciente de lados. La lon- 
gitud de la circunferencia así definida se re- 
presenta mediante el símbolo 27. Con más 
precisión, si pn indica el perímetro del polígo- 
no inscrito y qn el del polígono circunscrito, 
se tiene Pa < 27 < qn. Además, al crecer n, 
cada una de esas sucesiones pn y: qn tiende 
Fio. 167,—Aproximacio Monótonamente a 27, por lo que, con cada 
me e a circunferencia paso, disminuye el error de la aproximación 
a 27 que representan pn O qn- 
En la página 135 encontramos la expresión 


A EE 


que contiene m — 1 signos de raíces cuadradas, fórmula que puede 
utilizarse para calcular un valor aproximado de 2 vx. 


Ejercicios: 

1. Determínese el valor aproximado de m que proporcionan pa, ps y Pis. 

*2. Hállese una fórmula para qa. 

*Utilícese esa fórmula para calcular qa, q8 y 916. Habiendo calculado pie y 916, 
determínese una cota superior y otra inferior de x. 
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¿Qué es el número xz? La desigualdad pn < 27 < qn nos da una 
respuesta completa, pues determina un encaje de intervalos que defi- 
nen el punto 27. Sin embargo, esa respuesta deja algo que desear, 
pues no nos dice nada acerca de la naturaleza de 7 como número 
real; ¿es racional, irracional, algebraico o trascendente? Ya hemos 
dicho en la página 152 que x es un número trascendente y, por con- 
siguiente, irracional. Al revés de lo que ocurre con e, la demostración 
de la irracionalidad de z, que J. H. Lambert (1728-1777) dió por pri- 
mera vez, es bastante difícil, por lo que no la intentaremos reproducir 
aquí. Sin embargo, hay algunas otras propiedades referentes a z que 
están a nuestro alcance. Recordando aquella afirmación de que los 
números enteros son el material básico de la matemática, podemos 
preguntarnos si el número ~ tiene alguna relación sencilla con los 
enteros. Aunque se ha calculado la expresión decimal de x= con varios 
centenares de cifras, no aparece en ellas ninguna regularidad, lo que 
no es sorprendente, puesto que m y 10 nada tienen de común. Pero 
en el siglo xvin, Euler y otros matemáticos encontraron bellísimas 
expresiones, mediante series y productos infinitos, que establecen un 
lazo de unión entre los números enteros y x. Tal vez la más sencilla 
de todas estas fórmulas sea la siguiente: 


1 1 1 


ii dE 


23 


que expresa 7/4 como límite de la sucesión de sumas parciales: 


1 z : 1)» 
s=- A + (1 





2n+1 
Demostraremos esta fórmula en el capítulo VIII. Otra serie rela- 
tiva al número v es la siguiente: 
n? 1 1 1 1 1 1 
E ARO tate t at t 


Una notable expresión de m fué descubierta por el matemático 
inglés John Wallis (1616-1703); su fórmula dice que 
2 2 4 4 6 6 2n mn) x E 
13 3 5 5 7 mni nyi 2 en>, 
lo que a veces se escribe abreviadamente así: 
2 4 4 6 6 8 8 


e —— o me o m o a o M o 


3 3 5 5 7 7 9° 


La expresión que figura en el segundo miembro se llama un pro- 
ducto infinito. 


T 2 
2. 1 
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La demostración de estas dos fórmulas puede consultarse en cual- 
quier tratado de análisis matemático. 

*5, Fracciones continuas.—Las fracciones continuas conducen a 
casos interesantes de pasos al límite. Una fracción continua, tal como 


57 1 





14 
representa un número racional. Vimos en la página 57 que todo nú- 
mero racional puede escribirse en esa forma por medio del algoritmo 
de Euclides. Sin embargo, para los números irracionales, el algoritmo 
no termina después de un número finito de pasos, sino que conduce 
a una sucesión de fracciones de longitud creciente, cada una de las 
cuales representa un número racional. En particular, todos los nú- 
meros reales algebraicos (véase pág. 112) de grado 2 pueden expre- 
sarse de este modo. Como ejemplo, sea el número x = y/2 — 1, raíz 
de la ecuación cuadrática 


1 
2+ 3 





2+2r=1, x= 


Si en el segundo miembro se sustituye x por 1/(2 + x), se obtiene la 
expresión 





y a continuación, 





etcétera. 
De forma que después de reiterar n veces obtenemos la ecuación 


1 


2+ 2+ (n veces) 





2 +r 
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Al hacer tender n a infinito se obtiene la «fracción continua in- 
definida» 


y2=1+ 
2+ 
2+ 
2+ 


Esta notable fórmula relaciona 4/2 con los números enteros de 
forma más sorprendente que lo hace la expresión decimal de y 2, en 
la cual no aparece ninguna regularidad en la sucesión de sus cifras. 

Para la raíz positiva de cualquier ecuación cuadrática de la forma 


1 
z? = ar + 1, o t=dd 


se tiene el desarrollo 


r=a+ 1 
a+ 1 
a+ Para 
P. ej., para a = 1, obtenemos: 
= 1 
2=1Y(1+Y5=1+ m 
1+ == 
1+ 


1+ 


Estos ejemplos son casos particulares de un teorema. general, según 
el cual las raices reales de una ecuación cuadrática de coeficientes ente- 
ros admiten desarrollos en fracción continua periódica, exactamente 
como los números racionales poseen desarrollos decimales perió- 
dicos. 

Euler encontró desarrollos en fracción continua para e y m, casi 
tan sencillos como los anteriores. Daremos los siguientes, sin demos- 
tración: 
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e=2+ 1 , 
1+ 7 
2 + 7 
l+ - 
1+ A 
4 + 1 
1+ 7 
Ito 
1 
e=2 + i š 
l+ 7 
2 + 3 
3+ 4 
ETE 
T 1 
PT 12 
1+ 3 
2+ 51 
2+ 7 
2+ ry 
2+ 77 
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1. Introducción. Definición general.—En la página 301 y sucesivas 
pudimos dar una formulación precisa de la afirmación siguiente: «la 
sucesión an (es decir, la función an = F(n) de la variable entera n) 
tiene el límite a cuando n tiende a infinito». Daremos ahora la defini- 
ción correspondiente a esta otra afirmación: «la función u = f(x) de la 
variable continua zx tiene el límite a cuando x tiende a zı». En forma 
intuitiva, utilizamos ya este concepto de límite por aproximación 
continua de la variable independiente z en la página 295, para com- 
probar la continuidad de la función f(x). 
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Comenzaremos, como allí, por un caso particular. La función 
Ha) = (x + 28)/x está definida para todos los valores de x, salvo el 
x = 0, pues en este punto se anula el denominador. Al trazar la grá- 
fica de la función u = f(x) para valores de x del entorno de 0, parece 
evidente que, al «acercarse» x a cero por ambos lados, el correspon- 
diente valor de u = f(x) «se aproxima» al límite 1, Para dar una des- 
cripción precisa de este hecho debemos encontrar una fórmula expli- 
cita de la diferencia entre el valor de f(x) y el número fijo 1: 


as as — as 
ta 1 = P ESA 





Si convenimos en considerar exclusivamente valores de x próximos 
a 0, pero no el valor x = O [para el cual no está definida f(x)], po- 
demos dividir numerador y denominador 
del segundo miembro de esta ecuación por u 
x, obteniendo la fórmula más sencilla 


Kx) — 1 =x. 


Es evidente que esta diferencia puede 
llegar a ser tan pequeña como deseemos, 
siempre que x esté limitado en un inter- 
valo suficientemente pequeño del entorno 
de 0. Así, para x= 41/10, f(x) —1=1/100; 
para x= +1/100, f(x) —1=1/10000, etc. Fra. 168,—u = (2 + az. 
En general, si e es un número positivo, 
por pequeño que sea, la diferencia entre f(x) y 1 será menor que e, 
con tal que la distancia de x a O sea menor que el número 3 = y s. 
Pues entonces, si |x| < y e, resulta | f(x) — 1] =|7 |? < e. 

Es completa la analogía con nuestra definición de límite; en la 
página 303 decíamos que «la sucesión an tiene el límite a cuando n 
tiende a infinito, si en correspondencia con todo número positivo e, 
por pequeño que sea, puede encontrarse un entero N (que depende 
de e), y tal que | an — a| < e para todos los n que satisfacen la des- 
igualdad n > N». 

En el caso de una función f(x) de una variable continua x, cuando 
ésta tiende a un valor finito zı, nos limitamos a reemplazar el n «su- 
ficientemente grande», dado por N, por un z; «suficientemente próxi- 
mo», determinado por un número 3, llegando así a la siguiente defi- 
nición de límite por aproximación continua, que Cauchy fué el primero 
en enunciar, alrededor de 1820: La función f(x) tiene el límite a cuando 
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x tiende a xı si, para todo número positivo e, por pequeño que sea, 
puede encontrarse otro 3 (también positivo y dependiente de £), tal que 


Iæ) —=a|<e 
para todo x Æ x1 que satisfaga la desigualdad 
|r — zj < è. 
En este caso, escribiremos: 
Kz)>a cuando z> z. 


En el caso de la función f(x) = (x + 1%)/x, demostramos anterior- 
mente que f(x) tiende al límite 1 cuando z tiende al valor x, = 0. En 
dicho caso bastó elegir 3 = y e. 

2. Observaciones sobre el concepto de límite.—La definición (e, 3) 
de límite es el producto de más de un siglo de intentos y encierra en 
unas.pocas palabras el resultado de los persistentes esfuerzos para 
establecer este concepto sobre una base matemática firme. Los con- 
ceptos fundamentales del cálculo—los de derivada e integral —pueden 
definirse únicamente mediante pasos al mite. Una dificultad, al pa- 
recer insuperable, bloqueó durante mucho tiempo el camino hacia la 
comprensión clara y la definición precisa del concepto de límite. 

En el estudio del movimiento, los matemáticos de los siglos xvH1 
y xvi aceptaron como algo natural el concepto de cantidad z, que 
cambia continuamente y tiende, en un flujo continuo, hacia un valor 
límite zı. Asociado a este flujo primario del tiempo, o de una cantidad 
x que se comportaba como él, consideraron un valor secundario, 
u = f(x), que seguía el movimiento de x. El problema consistía en 
dar un significado matemático preciso a la idea de que f(x) «tiende» 
o «se aproxima» a un valor fijo a, cuando g tiende hacia zy. 

Desde la época de Zenón y de sus paradojas, el concepto intuitivo, 
físico o metafísico, de la continuidad del movimiento ha eludido todas 
las tentativas de una formulación matemática precisa, No hay nin- 
guna dificultad en proceder, paso a paso, a través de una sucesión 
discreta de valores a1, a2, 43, ... ; pero, al estudiar una variable con- 
tinua x que se extiende por todo un intervalo de la recta numérica, 
es imposible decir cómo ha de «aproximarse» x a un valor fijo zı, de 
tal manera que tome consecutivamente y en su orden de magnitud 
todos los valores del intervalo. Pues los puntos de una recta forman 
un conjunto denso, y no existe un punto «siguiente» después de ha- 
ber alcanzado uno prefijado. Ciertamente, la idea intuitiva del con- 
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tinuo posee una realidad psicológica en la mente humana; pero es 
imposible recurrir a ella para resolver una dificultad matemática; debe 
subsistir una discrepancia entre la idea intuitiva y el lenguaje mate- 
mático ideado para describir los rasgos científicamente importantes de 
nuestra intuición en una nomenclatura lógicamente precisa. Las para- 
dojas de Zenón son una importante indicación de esta discrepancia. 

El mérito de Cauchy consistió en comprender que, en lo que res- 
pecta a los conceptos matemáticos, puede y debe omitirse cualquier 
referencia a una idea intuitiva previa de la continuidad del movi- 
miento. Como ocurre a menudo, se abrió una senda hacia el progreso 
científico, renunciando a las tentativas en una dirección metafísica, 
y Operando exclusivamente con nociones que, en principio, correspon- 
den a fenómenos «observables». Si analizamos lo que realmente quere- 
mos dar a entender mediante las palabras «aproximación continua», o 
cómo debemos proceder para verificarla en un caso especial, nos vere- 
mos obligados a aceptar una definición tal como la de Cauchy. Esta 
definición es estátita: no presupone la idea intuitiva de movimiento. 
Por el contrario, sólo mediante una definición estática semejante es 
posible realizar un análisis matemático preciso de la continuidad del 
movimiento en el tiempo, y dar de lado las paradojas de Zenón en 
lo que a la ciencia matemática respecta. 

En la definición (e, 3), la variable independiente no se mueve; 
en ningún sentido físico puede decirse que «tienda» o «se aproxime» 
al límite xı. Permanecen todavía estas frases y el símbolo —>, y nin- 
gún matemático precisa perder de vista el fondo intuitivo que expre- 
san; pero cuando se trata de verificar la existencia de un límite en 
un proceso científico real, debe aplicarse la definición (e, 3) exclusi- 
vamente. Que esta idea corresponda satisfactoriamente o no a la 
noción intuitiva «dinámica», es un problema idéntico al de establecer 
si los axiomas de la geometría procuran una descripción satisfactoria 
del concepto intuitivo de espacio. Ambas formulaciones prescinden 
de algo que tiene intuitivamente una existencia real, pero proporcio- 
nan un esquema matemático adecuado para expresar nuestro conoci- 
miento de esos conceptos. 

Como en el caso del límite de una sucesión, la clave de la defini- 
ción de Cauchy consiste en invertir el orden «natural» en el que se 
consideran las variables. Primero fijamos nuestra atención sobre un 
intervalo e para la variable dependiente, tratando después de deter- 
minar otro intervalo conveniente ò para la variable independiente. 
Afirmar que «f(x) > a, cuando x —> xı» es sólo una manera breve de 
decir que eso puede hacerse para cualquier número positivo e. En 
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particular, ninguna parte de esta afirmación (p. ej., «x > 11» tiene 
significado por sí misma. 

Es necesario insistir sobre este punto: al hacer «tender» z a zı po- 
demos permitir que x sea mayor o menor que zı, pero excluímos expre- 
samente la igualdad, requiriendo que x Æ xı; x tiende a xı, pero sin 
tomar nunca el valor x,. Así podemos aplicar nuestra definición a 
funciones que no están definidas para x = qı, pero que tienen límites 
determinados, cuando z tiende a xı, como, p. ej., la función f(x) = 
= (x + 23)/x, considerada en la página 315. La exclusión de x = 21 
corresponde a lo que hacíamos en los límites de las sucesiones an 
para n > 00; p. ej., an = 1/n, en la cual no sustituímos n por oo en 
la fórmula. 

Sin embargo, cuando zx tiende a xı, f(x) puede aproximarse al límite 
a de tal manera que existan valores x + x, para los cuales f(x) = a; 
p- ej., al considerar la función f(x) = x/x cuando z tiende a cero, no 
pérmitimos nunca que z sea igual a 0, pero f(x) = 1, para todo x 3 0, 
y el límite a existe y es igual a 1, de acuerdo con nuestra definición. 

3. El límite de (sen x)/x.—Si x designa la medida de un ángulo en 
radianes, la expresión (sen x)/x está definida para todo x, excepto r=0, 
para el cual se convierte en el símbolo sin significado 0/0. El lector 
que posea una tabla de líneas trigonométricas podrá calcular el valor 
de sen x/r para valores pequeños de x. Como estas tablas proporcio- 
nan generalmente las líneas trigonométricas en función del arco ex- 
presado en grados, bastará recordar (pág. 289) que la medida en 
grados z está ligada con la medida en radianes mediante la rela- 
ción x = 7/180 y = 0,01745 y, con cinco cifras decimales. De una tabla 
que proporcione las líneas trigonométricas con cuatro cifras, se deduce: 













x = 0,1745 


0,0873 
0,0349 
0,0175 


sen r = 0,1736 


0,0872 
0,0349 
0,0175 


59 
20 










Aunque, según se ha dicho, estos valores únicamente tienen cua- 
tro cifras decimales exactas, resulta que 


sen zjx —> 1 cuando > U. li] 
Daremos ahora una demostración rigurosa de esta relación limite. 
De la definición de las líneas trigonométricas en el círculo unidad, se 


deduce que si z es la medida en radianes del ángulo BOC, para 
0 < 1 <w/2, se tiene: 
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Área del triángulo OBC=1/3 - 1 - sen zx. 
Área del sector circular OBC = 1/2 x (véase 
página 290). 
Área del triángulo OBA=1/2 + 1 + tg zx. 
Por tanto, sen x < x < tg x. 
Dividiendo por sen z, resulta: 
1 
senz cosa” Fic. 169. 











I< 


0 
nz 





cost < <1. [2] 


1 + cosx 


1 + cos x 
= sen?x/(1 + cos x) < sen?r, y como sen x < x, resulta que 


Pero 1 — cos x = (1 — cos 1) =(1 — cos? x)/(1 +cos x)= 
1 — cos z < 2?, [3] 
1 — r? < cos r. 

Teniendo en cuenta [2], se obtiene definitivamente: 


sen Tt 





l1-i< < 1. [4] 


Aunque hemos supuesto que 0 < r < rr/2, esta desigualdad es 





F : sen (—x)  —sen x 
también válida para —x/2 < x < 0, ya que —— = —__— = 
(—x) —T 
sen T 
=> y (8 = a. 


De [4] se deduce inmediatamente la relación [1], pues la diferen- 
cia entre (sen x)/x y 1 es menor que x?, que puede hacerse menor que 
cualquier número positivo e, por pequeño que sea, sin más que 
tomar |r| <= yz. 














Ejercicios: 
1. De la desigualdad [3] dedúzcase la relación límite (1— cos 1)x> 0, 
para r — 0. 
Determínense los límites, para x > 0, de las siguientes funciones: 
sen? zx sen r tgr sen ax 
2. .—— 4. - g 5. 
x xz — 1) z r 
é sen ar x sen x F sen x i i Sa rad 
. sen dx . l—cosz . AE st Tes me o en grados. 


1 1 1 


9. 








1 
== 10. 
z tgr sen x tgx 
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4. Límites para x -> oo .—Si la variable x es suficientemente 
grande, la función f(x) = ljr se hace arbitrariamente pequeña o 
«tiende a cero». En efecto, el comportamiento de esta función al cre- 
cer z es esencialmente el mismo que el de la sucesión 1/n al aumentar n. 
Daremos la definición general: La función f(x) tiene el límite a cuando x 
tiende a infinito, o en símbolos 


(0)> a para r= œo, 


si en correspondencia con todo número positivo e, por pequeño que sea, 
puede encontrarse otro, también positivo, K (que depende de e), tal que 
f(x) —a| < e, siempre que sea |x |> K. (Compárese ésta con la 
definición dada en las páginas 315, 316.) 

En el caso de la función f(x) = 1/x, para la cual es a = 0, basta 
tomar K =1Je, como podrá verificar el lector inmediatamente. 


Ejercicios: 
1. Demuéstrese que la definición anterior de la afirmación 


(> a cuando > œ 
equivale a esta otra: 


(2) > a cuando 1/x> 0, 


Demuéstrense las siguientes relaciones límites: 














z+1 a+x+1 
E >1 cuando r —> œ. 3. ————— > 1 cuando > œ» 
x—1 a-xz-—1 : 
sen T r+1 
4. >0 cuando > œo. 5. >0 cuando t —> 00. 
a+1 
sen zr sen z 
. ———— > 0 cuando > œ. 7. carece de límite para > oo. 
x + cosr cos x 


8. Definase: *f(x) > co cuando x > co ». Dése un ejemplo. 


Existe una diferencia entre el caso de una función f(x) y una sucesión an. En 
esta última, n puede tender a infinito sólo aumentando, mientras que para una 
función, x tiende a infinito-positiva o negativamente. Si deseamos restringir nues- 
tra atención al comportamiento de f(x) cuando x toma sólo valores positivos muy 
grandes, podemos reemplazar la condición |x| > K por x > K, mientras que 
para valores negativos muy grandes de x, utilizaremos la condición r < — K. 
Para expresar simbólicamente estos dos métodos de aproximación unilateral a 
infinito, escribiremos 


T> + œ t> —00, 


respectivamente. 
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TV. DEFINICIÓN PRECISA DE CONTINUIDAD 


Lo que dijimos en las páginas 294-97 equivale al siguiente criterio 
para reconocer la continuidad de una función: «Una función f(x) es 
continua en el punto zx = zq; si, cuando z tiende a zı, f(x) tiene como 
límite f(x1)». Si analizamos esta definición, se ve que consiste en exi- 
gir dos cosas enteramente distintas: 

a) Debe existir el límite a de f(x), cuando x tiende a zı. 

b) Este límite a debe ser igual al valor f(x1). 

Si en la definición de límite (pág. 316) hacemos a = f(x), la con- 
dición de continuidad adquiere la forma siguiente: la función f(x) es 





FıG. 170.— Función continua en x = xı. Fra, 171. —Función discontinua en x = 7;. 


continua para el valor x = x; si, para todo número positivo e, por pe- 
queño que sea, puede encontrarse otro 3, también positivo (que depende 
de e), tal que 

1/6) — May] <e 


para todo x que satisfaga la desigualdad 
|z — rij <3. 


(La restricción xx, impuesta en la definición de límite, es 
innecesaria aquí, puesto que la desigualdad | f(x) — f(xı) | < e se sa- 
tisface automáticamente.) 

Como ejemplo, comprobemos la continuidad de la función f(1)=x*, 
en el punto xı = 0. Se tiene 


Kz) = 03 =0. 


Asignemos ahora a e cualquier valor positivo, p. ej., e = 1/1000. 
Debemos demostrar ahora que si x se mantiene suficientemente pró- 
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ximo a x= 0, los valores correspondientes de f(x) no diferirán de 0 
más de 0,001; es decir, estarán situados entre —0,001 y 0,001. Se ve 
inmediatamente que no salen de ese intervalo si se impone la condi- 
ción de que los valores de z difieran de 1=0 en menos de 3= Y/0,001 = 
=0,1; pues si |x| < 0,1, se tiene que | f(x) | = <S < 0,001. De la 
misma forma, podemos reemplazar e = 0,001 por e = 104, 10-5, o 
cualquier ofro valor que deseemos. La condición quedará siempre sa- 
tisfecha si se toma 5= Y £, ya que si |x| < Ve | (| =P < €. 

Basándonos en la definición (e, 5) de la continuidad, es posible 
demostrar de manera análoga que los polinomios, las funciones racio- 
nales y las trigonométricas son funciones continuas, excepto para valo- 
res aislados de x, para los cuales la función puede hacerse infinita. 

Teniendo en cuenta la gráfica de una función u = f(x), la defini- 
ción de continuidad toma la siguiente forma geométrica. Elíjase un 
número positivo e y trácense paralelas al eje de las x a alturas f(21)—e 
y [(11)+€ por encima de él. Entonces, deberá ser posible hallar un 
número positive $, tal que todo el trozo de la gráfica que se encuen- 
tra dentro de la banda vertical de anchura 28 alrededor de xı esté 
contenido dentro de la banda horizontal de anchura 2e, alrededor 
de f(xı). En la figura 170 aparece una función que es continua en z, 
mientras que la figura 171 muestra una función que no lo es. En este 
último caso, por muy estrecha que sea la banda vertical alrededor 
de xı, siempre incluirá una porción de la gráfica que queda fuera de 
la banda horizontal correspondiente a la elección de e. 


St afirmo que una función dada u = f(x) es continua para x = xı, quiero decir 
que estoy dispuesto a convenir el siguiente contrato con el lector. Usted puede 
elegir cualquier número positivo e, tan pequeño como desee, pero fijo. Entonces 
debo determinar otro número 3, también positivo, tal que de |z — qi | < 3 se 
deduzca | f(x) — f(x1) | < e. No me obligo a ofrecer desde el principio un núme- 
ro 3 que sirva para cualquier e que usted subsiguientemente elija; mi elección de 8 
depende de la suya de e. Si usted puede elegir un solo valor de e para el cual yo 
sea incapaz de proporcionar el correspondiente 3, mi aserción queda al descu- 
bierto. De ahí que para demostrar que puedo cumplir el contrato, en cualquier 
caso concreto que se presente de una función u = f(x), generalmente construyo 
una función positiva explícita 


ò = p(e) 


que esté definida para todo número positivo £, para el cual se pueda demostrar 
que de | x — xı | < & se deduce siempre | f(x) — f(x1) | < e. En el caso de la fun- 
ción u = f(x) = 2%, para el yalor zı = 0, la función 3 = ọ(£) era 8 = Y e. 


Ejercicios: 
1. Demuéstrese que las funciones sen x y cos x son continuas. 
2. Demuéstrese la continuidad de 1/(1 + x4) y de y1 + x2. 
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Parecerá ahora evidente que la definición (e, 3) de la continuidad 
coincide con lo que podría considerarse como el conjunto de los he- 
chos observables respecto a una función. En esa forma, está de acuer- 
do con un principio general de la ciencia moderna según el cual el 
criterio de la utilidad de un concepto o la «existencia científica» de 
un fenómeno consiste (al menos en principio) en la posibilidad de su 
observación, o de su reducción a hechos observables. 


V. DOS TEOREMAS FUNDAMENTALES SOBRE 
LAS FUNCIONES CONTINUAS 


1. Teorema de Bolzano. —Bernard Bolzano (1781-1848), un sacer- 
dote católico, buen conocedor de la filosofía escolástica, fué uno de 
los primeros en introducir la moderna idea del rigor en el análisis 
matemático. Su importante opúsculo Paradoxien des Unendlichen apa- 
reció en 1850. Por primera vez se reconoció que, si han de utilizarse en 
toda su generalidad, pueden y deben demostrarse muchas proposi- 
ciones aparentemente evidentes, que se refieren a las funciones conti- 
nuas. Un ejemplo lo constituye el siguiente teorema sobre funciones 
continuas de una variable. Una función continua de una variable x, 
positiva para un cierto valor de x y negativa para otro, ambos pertene- 
cientes a un intervalo de continuidad cerrado a < x < b, debe tomar el 

` valor cero para algún valor intermedio de x. Esto es, si f(x) es continua, 
mientras x varía de a a b, siendo f(a) < 0 y f(b) > 0, debe existir un 
valor « de x tal que a < a < b y f(a) =0. 

El teorema de Bolzano corresponde perfectamente a nuestra idea 
intuitiva de una curva continua, la cual debe atravesar al eje x para 
pasar de un punto situado por debajo de él a otro que se encuentra 
por encima. La figura 157 pone de manifiesto que esto puede no ser 
cierto para una función discontinua. 


*2, Demostración del teórema de Bolzano. —Daremos ahora una demostra- 
ción rigurosa de este teorema. (Siguiendo a Gauss y a otros grandes matemáticos, 
podríamos aceptar y utilizar ese hecho sin demostración.) Nuestro propósito es el 
de reducir el teorema a las propiedades fundamentales del sistema numérico real, 
en particular al postulado de Dedekind-Cantor, el cual se refiere a los encajes de 
intervalos (pág. 77). Para ello, consideremos el intervalo I, a < x < b, en el cual 
está definida f(x), que dividiremos en dos partes por su punto medio xı = (a+b)/2. 
Si resultase ser f(x) = 0, el teorema quedaría demostrado. Sin embargo, si a) + 
A 0, f(x1) será mayor o menor que cero. En cualquiera de los dos casos, cada una 
de las dos mitades de 7 gozará ahora de la misma propiedad: f(x) tiene signo dis- 
tinto en ambos extremos. Llamemos I, a este nuevo intervalo y repitamos el 
mismo proceso, dividiendo 7, en dos partes iguales; será entonces f(x) = 0 en el 
punto medio de /;,, o, de lo contrario, podremos elegir un intervalo 72, mitad del /1, 
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tal que f(x) tenga signos distintos en ambos extremos. Repitiendo este procedi- 
miento, después de un número finito de bisecciones encontraremos un punto para 
el cual f(x) = 0, o tendremos una sucesión de intervalos encajados £,, fa, I3,* * * 
En este último caso, el postulado de Dedekind-Cantor asegura la existencia de 
un punto a en I, común a todos esos intervalos. Afirmamos que f(«) = 0, por lo 
que a es el punto cuya existencia demuestra el teorema. 

Hasta ahora no hemos utilizado la hipótesis inicial de la continuidad de la 
función. La usaremos ahora para completar la demostración mediante un breve 
razonamiento indirecto. Demostraremos que f(x) = 0, suponiendo lo contrario y 
deduciendo una contradicción. Supongamos que f(x) Æ 0; p. ej., f(x) = 2e > 0. 
Dado que f(x) es continua, podremos encontrar un intervalo J (tal vez muy pe- 
queño) de amplitud 23, cuyo punto medio sea «æ y tal que en todo él el valor de 


F1G. 172. — Teorema de Bolzano. 


[(x) difiera de [(«) en menos de e. Ahora bien: como f(a) = 2e, podemos asegurar 
que f(x) > e en todo punto de J, por lo que también se verificará que f(x) > 0 
en J. Pero como el intervalo J es fijo, bastará tomar n suficientemente grande 
para que el intervalo In quede enteramente dentro de J, ya que la sucesión In 
tiende a 0. Aquí aparece la contradicción, pues de la forma como se eligió Zn, re- 
sulta que la función f(x) debe tener signos opuestos en los extremos de todo Jn, 
por lo que f(x) tiene que tomar valores negativos en algún punto de J. El absurdo 
a que conduce suponer f(x) > 0 o bien f(a) < 0, demuestra que es f(x) = 0. 


3. Teorema de Weierstrass sobre valores extremos.—Karl Weier- 
strass (1815-1897) formuló otro hecho importante acerca de las fun- 
ciones continuas, que parece también evidente para la intuición. Tal 
vez más que a ningún otro matemático se debe a Weierstrass la ten- 
dencia moderna hacia el rigor en el análisis matemático. El teorema 
aludido dice: Si una función f(x) es continua en un intervalo I, a <x<b, 
incluídos los dos extremos a y b del intervalo, debe existir por lo menos 
un punto en I, donde f(x) alcanza su valor máximo M, y otro donde f(x) 
toma su valor mínimo m. Intuitivamente, esto significa que la gráfica 
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de la función u = f(x) debe tener, por lo menos, un punto más alto 
y otro más bajo. 

Importa hacer constar que el teorema puede no ser cierto si f(x) 
deja de ser continua en los extremos del intervalo I; p. ej., la función 
Ha) = 1/x no tiene un valor máximo en el intervalo 0 < x < 1, aun- 
que f(x) es continua en el interior de dicho intervalo. Tampoco pre- 
cisa una función discontinua tomar un valor máximo o mínimo, aun- 
que esté acotada; p. ej., considérese la función, evidentemente dis- 
continua, definida de la siguiente manera 


[(a) = x para zx irracional, 
f(x) =1/2 para x racional, 


en el intervalo 0 < x < 1. Esta función toma siempre valores com- 
prendidos entre 0 y 1, y precisamente tan próximos a 0 ó a 1 como 
queramos, si elegimos un valor irracional de x suficientemente, pró- 
ximo a 0 ó a 1; pero f(x) no puede ser nunca igual a 0 ó a 1, puesto 
que si x es racional, se tiene f(x) =1/2, y para x irracional, resulta 
[(x) = x, por lo que la función nunca alcanza los valores 0 ó 1, 


*El teorema de Weierstráss se puede demostrar de modo análogo al seguido 
para el de Bolzano. Dividimos Z en dos semiintervalos cerrados I'e 1”, y fijamos 
nuestra atención sobre 1”, como el intervalo donde debe buscarse el valor máximo 
de f(x), a menos que exista un punto œ en I”, tal que t(«) exceda a cualquier valor 
de f(x) en T; si así ocurriera, elegiríamos Į”. Llamaremos J; al intervalo así ele- 
gido. Procedemos ahora con Iı de igual forma que hicimos con Z, obteniendo un 
intervalo 72, etc. Mediante este proceso, se define una sucesión 11, Ia, Is, ***, In, ***, 
de intervalos encajados, que definen un punto z. Demostraremos que el valor 
f(z) = M es el mayor que toma la función en I; esto es, tal que no puede existir 
un punto s en F para el cual f(s) > M. Supongamos que exista un punto s tal 
que f(s) = M + 2e, donde e es un número positivo (quizá muy pequeño). Alre- 
dedor de z como centro, dado que f(x) es continua, limitaremos un pequeño inter- 
valo K, tal que s quede fuera de él y que los valores que en K tome f(x) difieran 
de f(z) = M en menos de e, por lo que se tendrá ciertamente, en K, f(x) < M + e. 
Pero, para un n suficientemente grande, el intervalo In queda dentro de K, y, por 
otra parte, se definió Zn de tal manera que ningún valor de f(x) para todo x fuera 
de In pudiera superar a los valores de f(x) para los x de In. Ya que s está fuera de 
In, y [(s) > M + e, mientras que en K y, por consiguiente, en In, tenemos que 
f(x) < M + e, hemos llegado a una contradicción. 

De la misma manera puede demostrarse la existencia de un mínimo m, o 
puede deducirse directamente de lo que ha sido ya demostrado, puesto que el 
valor mínimo de. f(x) es el máximo de g(x) = — f(x}. 

Puede probarse de manera idéntica el teorema de Weierstrass para funciones 
continuas de dos o más variables, x, y, -** En lugar de un intervalo completo (con 
sus extremos), debemos considerar un dominio cerrado; es decir, un rectángulo 
en el plano x, y, en el que se incluye su frontera. 
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Ejercicio: ¿En qué parte de las demostraciones de los teoremas de Bolzano y 
Weierstrass se utilizó la hipótesis de que f(x) estaba definida y era continua en todo 
el intervalo cerrado a < x < b, y no simplemente ena<z<bóa<zt<b? 


Las demostraciones de los teoremas de Bolzano y Weierstrass tie- 
nen un carácter decididamente no-constructivo. No proporcionan un 
método para encontrar realmente la situación de un cero o del valor 
máximo o mínimo de una función, con una precisión fijada de ante- 
mano, en un número finito de pasos. Se prueba tan sólo la mera exis- 
tencia, o, mejor dicho, el absurdo de la no-existencia de los valores 
deseados. Éste es otro ejemplo importante contra el cual han protes- 
tado los «intuicionistas» (véase pág. 95); algunos de ellos han insistido 
en que dichos teoremas deben eliminarse de la matemática. El estu- 
diante de matemática no ha de tomar todo esto más seriamente que 
la máyor parte de los críticos. 

*4, Un teorema sobre sucesiones. Conjuntos compactos.—Sea 21, 
£2, £z, ..., Una sucesión indefinida de números, distintos entre sí o no, 
contenidos todos en el intervalo cerrado I, a <x <b. La sucesión 
puede o no tender a un límite. En todo caso, es siempre posible extraer 
otra sucesión yı, y2, Y3, ..., también indefinida, omitiendo ciertos térmi- 
nos de la dada, y tal que tienda a un límite y, contenido en el intervalo 1. 

Para demostrar este teorema, dividimos el intervalo 7 en dos in- 
tervalos cerrados J' y I”, mediante el punto medio (a+b)/2 de 1: 


a+b 
2 y 





F:asr< 


a+b 


I”: 
2 





<xw<b, 


Por lo menos en uno de estos intervalos, que llamaremos J, se 
encontrarán infinitos términos xn de la sucesión original. Elijamos 
cualquiera de ellos, £n, y llamémosle y1. Procedamos ahora de la misma 
manera con el intervalo Jı. Puesto que existen infinitos términos Tp 
en J, deberán existir también infinitos en una al menos de las mita- 
des de Jı, que llamaremos Iz. Por tanto, podremos determinar cierta- 
mente un término zn de Iz para el cual n > m. Elijamos uno entre 
ellos y llamémosle yz. Procediendo de esta manera, encontraremos una 
sucesión de intervalos encajados, fi, I2, I3, ..., y una sucesión parcial 
Yis Y2 Y3, -.., de la primitiva, tal que yn se encuentre en In para todo n. 
Este encaje de intervalos define un punto y de I, y resulta evidente 
que la sucesión yı, Y2, Y3, ..., tiene el límite a, como se quería de- 
mostrar. 
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*Estas consideraciones son susceptibles de ser generalizadas en una forma que 
es típica de la matemática moderna. Consideremos una variable X que se extiende 
por un conjunto general S, en el cual se ha definido la noción de «distancia» de 
alguna manera. S puede ser un conjunto de puntos en un plano o en el espacio. 
Pero esto no es necesario; p. ej., S puede ser el conjunto de todos los triángulos 
del plano. Si X e Y son dos de esos triángulos, de vértices A, B, C, y A”. B’, C, 
respectivamente, podemos definir la «distancia» entre ambos triángulos mediante 
el número 


d(X, Y) = AA’ + BPB’ + CC, 


donde AA’, etc., denota lo que se entiende comúnmente por distancia entre los 
puntos A y A”. En cualquier conjunto S, en el que esté definida la noción de 
«distancia», podemos definir también el concepto de sucesión de elementos X;, 
X2, X3, ***, que tienden a un elemento límite X de S. Con ello queremos significar 
que d(X, X,) >. 0, cuando n tiende a oo. l 

Diremos ahora que el conjunto S es compacto si de una sucesión cualquiera de 
elementos Xy, X2, X3, ::*, de S, podemos extraer siempre otra sucesión parcial que 
tiende a un elemento límite X de S. En el párrafo precedente se ha demostrado 
que, en este sentido, un intervalo cerrado a < x < b es un conjunto compacto. 
De ahí que el concepto de conjunto compacto pueda considerarse como una gene- 
ralización del de intervalo cerrado de la recta numérica. Obsérvese que la recta 
numérica en su totalidad no es un conjunto compacto, puesto que la sucesión de 
números enteros, 1, 2, 3, 4, 5, ++», ni tiende a un límite, ni contiene una sucesión 
parcial convergente. Tampoco un intervalo abierto, sin incluir sus extremos, tal 
como 0 < x < 1, es compacto, puesto que la sucesión 1/2, 1/3, 1/4, -**, o cualquier 
sucesión parcial de la misma, tiende al límite cero, el cual no es un punto del inter- 
valo abierto. Del mismo modo puede demostrarse que la región del plano formada 
por los puntos interiores a un cuadrado o rectángulo no es un conjunto compacto, 
aunque sí lo es cuando se añaden los puntos frontera. Por otra parte, el conjunto 
de todos los triángulos cuyos vértices son interiores o están sobre la circunferen- 
cia de un círculo dado es compacto. 

Es también posible generalizar la noción de continuidad al caso en que la 
variable X varíe en un conjunto cualquiera S, en el cual se ha definido la noción 
de límite. La función u = F(X), donde u es un número real, se dice que es con- 
tinua en el elemento X si, para cualquier sucesión de elementos Xy, Xə, X3,***, 
que converja hacia X, la sucesión correspondiente de números F(Xy), F(X3),***, 
tiende al límite F(X). (Podría también darse una definición (e, 5) equivalente.) 
Es inmediato demostrar que el teorema de Weierstrass se verifica también en el 
caso general de una función continua definida para los elementos de un conjunto 
compacto cualquiera: 

Si es u = F(X) una función continua cualquiera, definida en un conjunto com- 
pacto S, existe siempre un elemento de S para el cual F(X) alcanza su valor máximo, 
y también otro en el cual toma su valor mínimo. š 

La demostración resulta sencilla una vez asimilados perfectamente los con- 
ceptos generales que figuran en el enunciado, pero no proseguiremos en la discu- 
sión de este tema. Según se verá en el capítulo VII, el teorema general de Weierstrass 
es de suma importancia en la teoría de los máximos y mínimos. 


328 FUNCIONES Y LÍMITES [cap. 6 





VI. ALGUNAS APLICACIONES DEL TEOREMA DE BOLZANO 


1. Aplicaciones geométricas.——El sencillo, aunque general, teore- 
ma de Bolzano puede utilizarse para demostrar múltiples proposicio- 
nes que en modo alguno resultan obvias a primera vista. Comencemos 
con la siguiente: Si A y B son dos áreas del plano, existe siempre una 
recta del mismo que simultáneamente divide en dos partes iguales a A 
y a B. Por un «área» queremos significar una porción cualquiera del 
plano encerrada por un contorno simple cerrado. 

Comencemos por elegir un punto fijo P del plano y tracemos por P 
una semirrecta PR, a partir de la cual mediremos los ángulos. Si 
tomamos un rayo PS, que forme un ángulo x con PR, existirá en el 
plano una recta paralela a PS que dividirá en dos partes iguales el 
área A. Pues si consideramos una recta lı paralela a PS y situada 

por completo de un mismo lado de 
xa A, trasladándola hasta la posición 
l2 (véase Fig. 173), al otro lado de 
A, la función cuyo valor sea la 
parte del área A situada a la de- 


i recha de la recta, menos el área 
de A situada a su izquierda, será 
pE a 


s xg positiva para la posición lı y nega- 
í An tiva para la posición l2. Puesto que 
PANAR esta función es continua, por el 


Fic. 173. — División simultánea de dos 
areas en partes Jeuales. teorema de Bolzano debe anularse 


para alguna posición intermedia lx, 
la cual, en consecuencia, dividirá A en dos partes iguales. Para cada 
valor de x desde x = 0° hasta x = 3600, la recta lx, que divide a A 
en dos partes iguales, está definida univocamente. 

Defínase ahora la función y = f(x) como el área de B a la derecha 
de lx, menos el área de B a la izquierda de lx. Supongamos que la 
recta lo, que divide a A en dos partes iguales y tiene la dirección de 
PR, corta a B de tal manera que deja a la derecha un trozo mayor 
que a la izquierda. Entonces, para x = 0°, y será positiva. Si x aumen- 
ta hasta 1800, la recta liso, cuya dirección coincide con la de RP, que 
divide a A en dos partes iguales, es la misma que lo; pero tiene sen- 
tido contrario, por estar intercambiadas la izquierda y la derecha, de 
donde se deduce que, numéricamente, el valor de y para x = 1800 es 
igual que para x = 0°, aunque de signo opuesto, es decir, negativo. 
Dado que y es una función continua de x, mientras lx efectúa una 
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vuelta completa existe algún valor « de x comprendido entre 0% y 
1800, para el cual y se anula. Sigue de ello que la recta 1, divide a A 
y B simultáneamente en partes iguales, como se quería demostrar. 

Obsérvese que, aunque hemos demostrado la existencia de una 
recta que goza de la propiedad enunciada, no hemos dado ningún 
procedimiento definido para construirla. Aparece una vez más este 
rasgo característico de las demostraciones matemáticas de existencia, 
en oposición a las construcciones. 

Un problema análogo es el siguiente: dado un dominio plano, se 
desea cortarlo en cuatro partes iguales, mediante dos rectas perpen- 
diculares. Para demostrar que esto es siempre posible, volvamos al 


lz+90 





FiG. 174. 


problema anterior y precisamente a aquella parte de la demostración 
donde definimos lz para cualquier ángulo x; pero prescindamos por 
completo del área B. En lugar de esto, tracemos la recta 1x0, que es 
perpendicular a lx y que también divide a A en dos partes iguales. Si 
numeramos las cuatro partes de A, como indica la figura 174, tendremos 


Ai + Áa = As + As 


y 
As + As = Ar + 44, 


de donde, restando la segunda igualdad de la primera, resulta: 


A1 — A3 = Az — Ai; 
es decir, 
Al = Az, 
y, por tanto, 
Az = Ás. 
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Así, pues, si podemos demostrar que existe un ángulo a tal que 
para l, sea 
Ara) = Aa), 


nuestro teorema quedará demostrado, ya que para tal ángulo las cua- 
tro partes serán iguales. Con este propósito, definimos una función 
y = f(x) trazando una recta Ix y haciendo f(x) = A(x) — Ae(2). 

Para x = 0°, (0) = Aı(0) — A2(0)} puede ser positiva. En ese caso, 
para x = 90°, f(90) = A1(90) — Az2(90) = Ag(0) — A3(0) = A2(0) — 
— A1(0), será negativa. En consecuencia, ya que f(x) varía de una 
manera continua, cuando x pasa de 0% a 900 existirá un cierto valor « 
entre 09 y 900, para el cual f(a) = Ar(a) — Ag(«) = 0. Entonces, la 
recta l, y su perpendicular l«+90 dividirán al dominio en cuatro partes 
iguales. 

Es interesante observar que estos problemas se pueden generalizar 
al caso de tres o más dimensiones, En tres dimensiones, el problema 
se enuncia así: Dados tres sólidos en el espacio, encontrar un plano 
que los divida simultáneamente en partes iguales. Se puede demos- 
trar, partiendo del teorema de Bolzano, que esto es siempre posible. 
Para más de tres dimensiones el teorema sigue siendo válido, pero la 
demostración requiere recursos de orden más elevado. 

*2, Aplicación a un problema de mecánica.—Terminaremos este 
capítulo discutiendo un problema de mecánica, aparentemente difícil, 
pero que es sencillo de resolver por un razonamiento basado en los con- 
ceptos de continuidad. (Este problema fué sugerido por H. Whitney.) 

Supongamos un tren que recorre un trayecto rectilíneo de vía entre 
las estaciones A y B. No es preciso que el móvil tenga velocidad o 
aceleración uniformes durante el recorrido; el tren puede acelerarse, 
retardarse, detenerse y aun retroceder durante algún tiempo antes de 
alcanzar B. Pero se supone conocido de antemano el movimiento 
exacto del tren; es decir, se supone dada la función s = f(t), donde s 
es la distancia del tren a la estación A y 1 el tiempo, medido a partir 
del instante de salida. Sobre el suelo de uno de los vagones hay una 
varilla conectada de forma que puede moverse sin rozamiento, hacia 
delante o hacia atrás, hasta tocar el suelo. Si llega a tocar el suelo, 
supondremos que permanece en esta posición definitivamente. Nos 
preguntamos si es posible colocar la varilla de tal manera que si se 
abandona en el momento en que el tren inicia su movimiento, que- 
dando entonces exclusivamente sujeta a la influencia de la gravedad 
y del movimiento del tren, no caiga al suelo durante todo el trayecto 
desde A hasta B. Podrá parecer sumamente improbable que, para 
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cualquier ley de movimiento, dada la acción conjunta de la gravedad 
y de las fuerzas de reacción, sea siempre posible el mantenimiento de 
dicho equilibrio con la única condición de elegir convenientemente la 
posición inicial de la varilla; con todo, nuestra afirmación es que dicha 
posición existe siempre. 

Por paradójica que esta aserción parezca a primera vista, puede 
demostrarse fácilmente si nos concentramos en su carácter esencial- 
mente topológico. No se precisa para ello de un conocimiento deta- 
llado de las leyes de la dinámica y sólo es necesario suponer realizada. 
la siguiente hipótesis de naturaleza física: El movimiento de la varilla 
depende con continuidad de su posición inicial. Caractericemos la posi- 
ción inicial de la varilla por el ángulo x, que forma inicialmente con 
el suelo del vagón, y por el ángulo y, que forma con dicho suelo al 


Fic. 175. 


final del trayecto, cuando el tren llega al punto B. Si la varilla ha 
caído al suelo, o bien es y = 0 ó y = x. Para una posición inicial 
dada x, la posición final y estará, de acuerdo con nuestra hipótesis, 
univocamente determinada mediante una función y = g(x), que es 
continua y toma los valores y = 0 para x = 0 e y =x para »=x 
(esto último expresa, simplemente, que la varilla permanecerá sobre 
el suelo si ésta es su posición al iniciar el viaje). Recordemos que por 
ser g(x} una función continua en el intervalo 0 £ x £ m, toma todos 
los valores entre g(0) = 0 y g(r) = rx; en consecuencia, para cualquier 
valor de y, p. ej., para y = x./2, existe un valor determinado de z tal 
que g(x) = y. En particular, existirá una posición inicial para la cual 
la posición final de la varilla en B será perpendicular al suelo. (Nora: 
No debe olvidarse en este razonamiento que el movimiento del tren 
está dado de antemano.) 

Es evidente que la argumentación es por completo teórica; si el 
viaje es de larga duración o si la ley de movimiento del tren, expre- 
sada por s = f(t}, es muy arbitraria, entonces el número de posiciones 
iniciales x para las que la posición final g(x} es distinta de 0 o de zx 
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será muy pequeño, como sabe cualquiera que haya intentado mante- 
ner verticalmente una aguja sobre una superficie plana durante un 
tiempo apreciable, Con todo, nuestro razonamiento será apreciado 
incluso por una mentalidad práctica, pues pone de manifiesto la posi- 
bilidad de obtener resultados cualitativos en dinámica por simple 
razonamiento, sin recurrir a unà manipulación experimental. 


Ejercicios: 

1. Utilizando el teorema de la página 326, demuéstrese que es posible gene- 
ralizar el razonamiento anterior para el caso de un viaje de duración infinita, 

2. Generalícese para el caso en que el tren se mueve siguiendo una curva 
plana cualquiera y la varilla puede caer en cualquier dirección. Obsérvese que 
no es posible representar un disco circular sobre una circunferencia exclusiva- 
mente mediante una transformación continua que deje fijo todo punto de la cir- 
cunferencia (véase pág. 267). 

3. Demuéstrese que el tiempo que precisa la varilla para caer al suelo, si el 
movimiento del tren es estacionario y la varilla se aparta un ángulo e de la posi- 
ción vertical, tiende a infinito al tender e a cero. 


SUPLEMENTO AL CAPÍTULO VI 


MÁS EJEMPLOS SOBRE LÍMITES 
Y CONTINUIDAD 


1. EJEMPLOS DE LÍMITES 


1. Observaciones generales. —En muchos casos, puede demostrarse 
la convergencia de una sucesión an mediante el recurso de hallar otras 
dos sucesiones bn y Cn, cuyos términos tengan una estructura más 
sencilla que los de la primera y tales que 


bn < an < Cn i1 


para todo n.' Entonces, podemos demostrar que si las sucesiones bn y Cn 
convergen ambas hacia: el mismo límite a, también ay tiende a dicho 
límite a. Queda a cargo del lector la demostración formal de esta 
afirmación. 

Es evidente que al aplicar este procedimiento, deberán utilizarse 
desigualdades; en consecuencia, conviene recordar algunas reglas ele- 
mentales que rigen las operaciones aritméticas con desigualdades. 

1. Sia>b,es a +c> b +c. (Puede sumarse cualquier número 
a los dos miembros de una desigualdad.) 

2. Si a> b y el número c es positivo, se tiene ac > bc. (Puede 
multiplicarse una desigualdad por cualquier número positivo.) 

3. Sia<b, es —b < —a. (Se invierte el sentido de una desigual- 
dad multiplicándola por —1.) Así, de 2 < 3, resulta —3 < —2, 

4, Si a y b tienen el mismo signo, y es a < b, resulta 1/a > 1/b. 

5. Ja+b|Z</al+1b1. 

2. Límite de q".—Si q es un número mayor que 1,.la sucesión qn 
llegará a exceder a cualquier número, como lo hace la siguiente: 2, 
22, 23, ..., en la cual es q = 2; la sucesión «tiende a infinito» (véase 
página 305). En el caso general, la demostración se basa en la impor- 
tante desigualdad (demostrada en la pág. 22) 


(1 +A) >14+n4>mnh, (2] 


donde h es un número positivo cualquiera. Hagamos q = 1 + h, 
siendo h > 0. Se tiene entonces 


g = (1 + h) > nh. 
333 
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Si k es un número positivo cualquiera, por grande que sea, para 
todo n > k/h se deduce que 


q? > nh >k, 


de donde resulta que q” —> œo. 

Si q = 1, todos los términos de la sucesión q” serán iguales a 1, 
y éste es también el límite de la sucesión. Si q es negativo, qn tomará 
alternativamente valores positivos y negativos, y no tendrá límite 
siq < —1. 


Ejercicio: Dése una demostración rigurosa de esta última afirmación. 


En la página 73 demostramos que q. >0 si es —1 < q < 1. Po- 
demos dar otra demostración muy sencilla de ese hecho. Considera- 
remos primero el caso 0 <q < 1; los números q, q?, q3,... forman 
una sucesión monótona decreciente, acotada inferiormente por 0. De 
acuerdo con lo dicho en la página 306, la sucesión debe tender a un 
límite: q2 > a. Multiplicando ambos miembros de esa relación por q 
se tiene: qnti > aq. 

Pero qu+1 debe tener el mismo límite, ya que no importa que el 
exponente sea n o n + 1; luego aq = a, o sea a(q — 1) = 0. Puesto 
que 1 — q + 0 esa igualdad implica que a = 0. 

Si q =0, la afirmación q» >0 es trivial. Si —1 < q < 0, se tiene 
0<l|ql|<1, de donde se sigue que |q" | = |q |" >0, de acuerdo 
con el razonamiento anterior. De todo ello resulta que se tiene siempre 
q? >0 para |q] < 1, con lo que queda completada la demostración. 


Ejercicios: Demuéstrese que para n— oo: 

1. (22/01 + 22)]2 > 0. 

2. [2/(1 + 22)]2> 0. 

3. [13/(4 + x2)]n tiende a infinito para z > 2 y a cero para |x| < 2. 

3. Límite de 4/ p.—La sucesión an = 4/ p, es decir, la sucesión p, 
VD Y p, Y p» ... tiene el límite 1 para todo número positivo fijo p: 


Vp> 1 cuando n> 00. [3] 


(Mediante el símbolo Y p representamos, como de costumbre, la raíz 
enésima positiva. Para los números p negativos no existen raíces ené- 
simas reales, si n es par.) 

Para demostrar la relación [3], comencemos por suponer que p>1; 
entonces, 4/ p será también mayor que 1, por lo que podemos escribir: 


Vp=1+h, 
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donde hn es un número positivo que depende de:n. De acuerdo con 
la desigualdad [2] resulta que 


p =(1 + hn)? > nh. 


Al dividir por n, vemos que 
0< fin < pin. 


Puesto que las sucesiones bn = 0 y cn = p/n tienen ambas el límite 0, 
de lo dicho en la página 333 se sigue que hn también tiene límite 0, 
con lo que nuestra afirmación queda demostrada para p > 1. Éste es 
un ejemplo típico de un método de determinación de límites, que 
consiste en encerrar la sucesión problema entre otras dos, cuyos limi- 
tes son conocidos o más fáciles de obtener. 

Incidentalmente, hemos deducido una estimación de la diferencia 
hp, entre 4/ p y 1, encontrando que ésta es siempre menor que p/n. 

Si 0 < p < 1, entonces 4/ p < 1, por lo que podemos escribir: 


Vp = + ha ; 
donde hn representa de nuevo un número positivo que depende de n. 
De ello se deduce que 


1 1 
a 


P= AF na E nh 


esto es, 


1 
0< hn < — 
np 


De esta última relación concluímos que hn tiende a cero al crecer n; 
pero, dado que 4/ p = 1/(1 + ha), resulta que 4/p > 1. 

El efecto nivelador de la extracción de la raíz enésima, que hace 
tender hacia 1 a cualquier número, al aumentar n,-es incluso eficaz 
aun cuando. la cantidad bajo el signo radical no permanezca cons- 
tante. Vamos a demostrar que la sucesión: 1, y 2, 4/3, Y 4, ...tien- 
de a 1; es decir, que 


Vn> 1 


al tender n a infinito. Es posible también deducir este caso por apli- 
cación de la desigualdad [2]. En lugar de tomar la raíz n-ésima de n, 


tomemos la raíz n-ésima de y/n. Si “escribimos Y/ Vn = 1 + kn, 
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siendo kn un número positivo que depende de n, esta desigualdad 
nos proporciona y/n = (1 + kn)" > nkn; por lo que 
Va 1 

n è shn 





kn < 
De donde resulta 


Va 2 2 1 
1< Vn=(1 + kn} =1 + 2kn + k, < 1+- +t- 
Vn A 


El segundo miembro de esta desigualdad tiende a 1, al crecer n, 
por lo que 4/n debe tender también a 1. 

4. Las funciones discontinuas como límites de funciones conti- 
nuas.—Podemos considerar límites de sucesiones an cuyos términos no 
sean constantes, sino dependientes de una variable z; p. ej., an=fn(x). 
Si esta sucesión converge cuando n —> oo, el límite será a su vez una 


función de z, 
[(2) = lim fax). 


Estas representaciones de ciertas funciones f(x) como límites de 
otras son, a menudo, muy útiles para reducir funciones «superiores» 
H(x) a las funciones elementales fn(x). 

Esto es cierto, en particular, en la representación de las funciones 
discontinuas mediante fórmulas explícitas. Consideremos, p. ej., la 
sucesión fn(x) = 1/(1 + x22), Para |x| = 1, tenemos xén = 1 y, en 
consecuencia, f(x) = 1/2, cualquiera que sea n, de donde resulta 
falx) >1/2. Para |x| < 1, se tiene que x2n > 0, o sea que fn(x) > 1, 
mientras que para |x| > 1 tenemos xn > oo, de donde se deduce 
que. fn(x) > 0. En resumen, 

1 para |x|<i, 


f(x) = lim 1/2 para |x| = 1, 


1 + xn = 
0 para |x]>l1. 


En este caso la función discontinua f(x) está representada como el 
límite de una sucesión de funciones racionales continuas. 
Otro ejemplo interesante de carácter análogo es el de la sucesión 
x? x? a 
falz) = 22 + Fa ta Fa + E aia 





Para x=0 todos los valores de fn(x) son cero, luego f(0) =lím fn(0)=0. 
Para 1 4 0, la expresión 1/(1 + x?) = q es positiva y menor que 1; 
las propiedades conocidas de la serie geométrica nos permiten asegu- 


SEC. 1] EJEMPLOS DE LÍMITES 337 








rar la convergencia de fn(x) para n > 00. El límite, es decir, la 
suma de la progresión geométrica indefinidamente prolongada es: 
q2 a? 
Pr ap ee 
1 + 
JŒ) =1 + z? para x Æ 0 y a f(x) = 0 para x = 0. Esta función tiene 
una discontinuidad evitable para x = 0. 

*5. Límites por iteración.—Con frecuencia, los términos de una 
sucesión son de tal naturaleza que se deduce an+ı de an mediante el 
mismo procedimiento por el cual se calculó an a partir de an-ı; repi- 
tiendo el proceso indefinidamente, se obtiene toda la sucesión par- 
tiendo de un término inicial dado. En tales casos, decimos que se 
trata de un proceso de «iteración». 

Por ejemplo, la sucesión 


1, VTF VIVA Vi+Vit Va. 


tiene una ley de formación de ese tipo; cada término posterior al pri- 
mero se forma extrayendo la raíz cuadrada de 1 más el que le pre- 
cede. Así, la fórmula 





= 1 + 22, Se ve así que fn(x) tiende a la función 





ai = 1, anı = Vi + an 


define toda la sucesión. Calculemos su límite: evidentemente, an es 
mayor que 1 para n > 1; además, an es una sucesión monótona cre- 
ciente, pues 


ai qn as = (1 + an) — (1 + an-1) = an — đn-1. 


De aquí resulta que si es an > an-ı, será también any1 > An; pero 
sabemos que az — ay = y 2 — 1 > 0, de donde deducimos por in- 
ducción que an+ı > Ay para todo n; es decir, que la sucesión es monó- 


tona creciente. Además, está acotada, pues de lo anterior resulta: 


1 + an ltd gy 
An+1 An+1 An+1 





< 2. 





An+1 = 


Por el principio de las sucesiones monótonas deducimos que, para 
n > 00, An > a, siendo a un número comprendido entre 2 y 1. Es 
fácil ver que a es la raíz positiva de la ecuación r? = 1 + x, pues, 
«para n > 00, la ecuación a, =1 + an se convierte en a2 =1 + a. 
Resolviéndola, se encuentra que la raíz positiva es a = (1 + y5)/2. 
Podríamos resolver esta ecuación mediante un proceso de iteración, 
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lo que nos proporcionaría el valor de la raíz con cualquier grado de 
aproximación deseado, siempre que se avanzase lo suficiente en dicho 
proceso. 

Es posible resolver muchas otras ecuaciones algebraicas por proce- 
dimientos análogos de iteración; p. ej., podemos escribir la ecuación 
cúbica r3 — 3x + 1 = 0 de la siguiente manera: 


1 


r = = 
3 — a 





Si elegimos ahora un valor cualquiera para a, p. ej., ay = 0, y po- 
nemos: i 
An41 = , 


2 
— aa 


obtendremos la sucesión: ag = 1/3 = 0,3333...; aa = 9/26 = 0,3461 ...; 
as = 676/1947 = 0,3472 ..., etc. Puede demostrarse que la sucesión an, 
obtenida de esta forma, converge hacia el límite a = 0,3473..., que 
es una solución de la ecuación cúbica dada. Estos procesos de itera- 
ción tienen una gran importancia, tanto en la matemática pura, donde 
proporcionan «demostraciones de existencia», como en la aplicada, en 
cuyo caso suministran métodos aproximados para la resolución de 
muy distintas clases de problemas. 





Ejercicios sobre límites. Para n> oo: 
1. Demuéstrese que Vin +1 — Vn> 0. (Escríbase la diferencia en la forma 


Vn +1 — V n 
Va+1+Vn 
2. Determínese el límite de y n2? + a — V n? + b. 
3. Hállese el límite de V n? + an +b -— n. 
1 
4. Calcúlese el límite de -5===—5= 
y n+i+ V n 
: E T 
Demuéstrese que el límite de Vn +1es 1. 
¿Cuál es el límite de Van + bn sia >b>0? 


¿Cuál es el límite de V an + bn +e sia >b>c>0? 
8. Más adelante veremos (pág. 459) que e = lím [1 +- (1/n)]2. ¿Cuál será en- 
tonces el límite de (1 + 1/n2)n? 





(Vna+1+Vn).) 





Jo a 


I. UN EJEMPLO SOBRE CONTINUIDAD 


La demostración rigurosa de la continuidad de una función requiere 
la comprobación explícita de la definición dada en la página 321. A veces 
esto entraña un procedimiento muy lento, si bien, afortunadamente 
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como veremos en el capítulo VIII, la continuidad es una consecuen- 
cia de la diferenciabilidad. Ya que esta última propiedad se estable- 
cerá sistemáticamente para todas las funciones elementales, podemos 
seguir el procedimiento habitual de omitir las demostraciones enojo- 
sas de la continuidad en cada caso particular. Pero, como un ejemplo 
aclaratorio de la definición general, analizaremos otro caso: la fun- 
ción f(x) =1/(1 + 22). Podemos restringir la variación de r a un 
intervalo prefijado |x| < M, siendo M un número arbitrariamente 


elegido. Si escribimos F 


1 1 L? — Ty 
la) — ia) = —- —— = — 
A 148 14% (14+%(4+2) 
ii (z + 21) 


(1 + 23) (142%) 
encontramos que para |x| <M y |t} sM 


| KED = (|< |z — z |z + t| < |z — |: 2M, 


de donde se deduce claramente que el primer miembro será menor 
que cualquier número positivo e, con tal que | 1, — x | < ò = £/2M. 

Deberá observarse que hemos sido muy generosos en nuestras 
apreciaciones. Para valores mayores de x y zı, el lector podrá ver 
por sí mismo que hubiera bastado tomar un 3 mucho mayor. 


CAPÍTULO VII 
MÁXIMOS Y MÍNIMOS 


Introducción.—Un segmento rectilíneo es la línea más corta entre 
dos puntos. Un arco de círculo máximo es la curva más corta que une 
dos puntos de úna superficie esférica. Entre todas las curvas planas 
cerradas de la misma longitud, la circunferencia encierra el área mayor; 
entre todas las superficies cerradas de igual área, la esfera encierra 
el mayor volumen. 

Estas propiedades de máximo y mínimo eran conocidas de los 
griegos, aunque a menudo se enunciaban los resultados sin serio in- 
tento de dar la demostración. Se atribuye a Herón de Alejandría 
(siglo 1 a. de J.C.), uno de los más significativos descubrimientos de 
la ciencia griega. Se sabía, desde mucho tiempo antes, que un rayo de 
luz procedente de un punto P y que incide sobre un espejo plano L, 
en un punto R, se refleja en dirección a un punto Q, tal que PR y 
QR forman ángulos iguales con el espejo. Herón encontró que si R’ 
es otro punto del espejo, la distancia total PR’ + R'Q es mayor que 
la distancia PR + QR. Este teorema, que demostraremos a continua- 
ción, caracteriza la trayectoria real PQR, de la luz, como el camino 
más corto posible entre P y Q, que toca al espejo, descubrimiento que 
puede considerarse como el germen de la óptica geométrica. 

Es muy natural que los matemáticos se interesen por cuestiones 
de este tipo. En la vida diaria se presentan constantemente proble- 
mas de máximos y mínimos, de lo «óptimo» y lo «peor». Muchas cues- 
tiones de importancia práctica se plantean de este modo; p. ej., ¿qué 
forma ha de tener una nave para presentar una resistencia mínima al 
agua? ¿Cuál es el recipiente cilíndrico, construído con una cantidad 
dada de chapa, que tiene un volumen máximo? 

Habiéndose iniciado en el siglo xvit, la teoría general de los valores 
extremos—máximos y mínimos—se ha convertido en uno de los 
principios sistemáticos integrantes de la ciencia. Los primeros pasos 
de Fermat en su cálculo diferencial estuvieron animados por el deseo 
de estudiar las cuestiones de máximos y minimos por medio de méto- 
dos generales. En el siglo siguiente, se amplió el campo de aplicación 
de estos métodos mediante la invención del cálculo de variaciones. Era 
cada vez más evidente que las leyes físicas de la Naturaleza encon- 
traban su expresión más adecuada en el principio de mínimo, el cual 
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proporciona un acceso natural a una solución más o menos completa 
de problemas particulares. Una de las realizaciones más notables de 
la matemática contemporánea es la teoría de los valores estaciona- 
rios, generalización del concepto de valores extremos, que combina el 
análisis con la topología. La exposición que haremos de toda esta 
cuestión será completamente elemental. 


I. PROBLEMAS DE GEOMETRÍA ELEMENTAL 


1. Triángulo de área máxima, dados dos lados.—Se dan dos seg- 
mentos a y b, y se pide hallar el triángulo de área máxima que 
tenga esos segmentos por lados. La solu- 
ción es sencillamente el triángulo rectángu- 
lo de catetos a y b. Pues si consideramos + 
cualquier triángulo (Fig. 176), dos de cuyos 
lados sean a y b, y h la altura respecto a a a 
como base, el área del triángulo será Fic. 176. 

A =1f2ah. Ahora bien: 1/2ath será máximo 
cuando sea máximo h, lo que ocurrirá si h coincide con b; es decir, 
para un triángulo rectángulo. Por tanto, el área máxima es 1/2ab. 

2. Teorema de Herón. Propiedad extremal de los rayos luminosos. 
Sea una recta L y dos puntos P y Q al mismo lado de L; ¿para qué 
punto R de L es PR + RQ la trayectoria mínima de P a Q tocando 
a L?' Éste es el problema de Herón del rayo luminoso. (Si L fuera la 
ribera de un río y alguien tuviera que ir de P a Q tan rápidamente 
como fuera posible, teniendo que sacar durante el camino un cubo 
de agua de L, tendría que resolver precisamente este problema.) 

Para hallar la solución, reflejemos P sobre L como si fuera un 
espejo, obteniendo el punto P”, de tal manera que L es la mediatriz 
de PP". La recta P'Q corta a la L en el punto buscado R. Es inme- 
diata la demostración de que PR + RQ es menor que PR’ + R'Q, 
para cualquier otro punto R’ de L. Puesto que PR = P'R y PR'= 
= P'R', se deduce que PR + RQ = P'R + RQ =P, y que 
PR' + R'Q = P'R' + R'Q. Pero como P'R' + R'Q es mayor que 
P'Q (puesto que la suma de dos lados cualesquiera de un triángulo 
es mayor que el tercero), resulta que PR' + R'Q es mayor que 
PR + RQ, como se quería probar. En lo que sigue, supondremos que 
ni P ni Q se encuentran sobre L. 

De la figura 177 se deduce que son iguales los ángulos 2 y 3, así 
como los 2 y 1, luego también son iguales 1 y 3. En otras palabras, 
R es un punto tal que PR y QR forman ángulos iguales con L. De esto 
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se deduce que un rayo luminoso que se refleje en L (del cual se sabe 
por experiencia que forma ángulos iguales de incidencia y de refle- 
xión) sigue en realidad la trayectoria más corta que conduce de Pa Q 
pasando por L, como antes se 
afirmó en la introducción. 

Puede generalizarse el proble- 
ma para incluir el caso de varias 
rectas, L, M, ... Sean, p. ej., dos 
rectas L y M, y dos puntos P y 
Q, situados como en la figura 178; 
el problema consiste en encontrar 
la trayectoria mínima de P a L, 
de aquí a M y después a Q. Sea 
Q’ el simétrico de Q, respecto a la 

FlG. 177.— Teorema de Herón, recta M, y Q” el de Q’ respecto a L. 

Trácense las rectas PQ”, que corta 
a Len R, y RQ', que corta a M en S$; los puntos R y S son los bus- 
cados, siendo PR + RS + SQ el camino mínimo de P a Q, que pasa 
por L y M. La demostración es muy parecida a la del problema an- 
terior y queda al cuidado del lector. Si L y M fueran espejos, un rayo 








sx 


Q 


Fic. 178, — Reflexión sobre dos espejos. 


luminoso procedente de P, que se reflejara en L y después en M, 
para seguir hacia Q, incidiría sobre L en R y sobre M en S, de donde 
resulta otra vez que el rayo luminoso sigue la trayectoria de longitud 
mínima. 

Cabe preguntarse cuál es la trayectoria mínima de P a M, des- 
pués a L y desde allí hasta Q. Esto daría una trayectoria PRSQ 
(Fig. 179), determinada de manera análoga a la anterior PRSQ. La 
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longitud de la primera trayectoria puede ser mayor, igual o menor 
que la de la segunda. 
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Fia. 179. 


*Ejercicio: Demuéstrese que la primera trayectoria es menor que la segunda 
si O y R están a un mismo lado de la recta PQ. ¿En qué caso tendrán ambas tra- 
yectorias igual longitud? 





3. Aplicaciones a problemas sobre triángulos.—Con ayuda del teo- 
rema de Herón puede obtenerse fácilmente la solución de los dos 
problemas siguientes: a) Dados el área A y un lado c = PQ de un 
triángulo, determínese éste 
de forma que la suma de 
los otros dos lados a y b sea 
mínima. Conocer el lado c 
y el área A de un triángu- 
lo equivale a conocer el lado 
c y la altura correspondien- 
te h, ya que A =1/fahc. Con 
referencia a la figura 180 el Q 
problema consiste, por tan- F1G, 180.— Triángulo del perímetro mínimo, dadas 
to, en determinar un punto su área y su base. 

R tal que la distancia del 

mismo a la recta PQ sea igual a la altura dada h, y de manera que 
la suma a + b sea mínima. De la primera condición se deduce que R 
debe ser un punto de la paralela a PQ a la distancia h. La solución 
nos la procura el teorema de Herón para el caso especial en que P y Q 
equidistan de L; el triángulo pedido, PRQ, es isósceles. 

b) De un triángulo se conocen el lado c y la suma a + b de los 
otros dos lados; de todos los triángulos posibles, hállese el de área 
máxima. Éste no es otro que el problema inverso del a), y la solu- 
ción es nuevamente el triángulo isósceles para el cual a == b. Según 
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acabamos de demostrar, en este triángulo es mínimo el valor de 
a + b; es decir, en cualquier otro triángulo de base c y de igual área, 
es mayor el valor de a + b. Además, resulta evidente de a) que cual- 
quier triángulo de base c y área mayor que la del triángulo isósceles 
tiene también mayor la suma de a y b. En consecuencia, cualquier 
otro triángulo que tenga los mismos valores para a + b y c debe tener 
un área menor, de forma que el triángulo isósceles es el de área má- 
xima, dados c y a + b. 

4. Propiedades de las tangentes a la elipse y a la hipérbola. Pro- 
piedades extremales de las mismas.—El problema de Herón está rela- 
cionado con algunos teoremas geométricos importantes. Hemos de- 
mostrado que si R es un punto de L, tal que PR + RQ es mínima, 
PR y QR forman ángulos iguales con L. Llamaremos 2a a esa dis- 
tancia total mínima. Designemos por p y q las distancias de un punto 
cualquiera del plano a P y Q, res- 
pectivamente, y consideremos el 
lugar geométrico de fodos los pun- 
tos del plano, para los cuales, 
p+q=2 Este lugar es una 
elipse, de focos P y Q, y que pasa 
por el punto R de la recta L. 
Además, L debe ser tangente a la 

FiG. 181.— Propiedad de la tangente elipse en R. Si L cortase a la 
a la elipse, elipse en un punto distinto de R, 
debería existir un segmento de L 
interior a la elipse, y para cada punto del mismo, p + q sería menor 
que 2a, ya que es fácil ver que p + q es menor que 2a para los puntos 
interiores a la elipse, y mayor para todo punto exterior. Puesto que 
sabemos que la desigualdad p + q > 2a no se cumple para ningún 
otro punto de L, esta última hipótesis es imposible. De ahí que L deba 
ser tangente a la elipse en R. Pero como sabemos que PR y RQ for- 
man ángulos iguales con L, hemos demostrado incidentalmente el 
siguiente teorema importante: Cualquier tangente a una elipse forma 
ángulos iguales con los radios vectores que unen el punto de tan- 
gencia a los focos. 

El siguiente problema está íntimamente relacionado con la con- 
clusión anterior: Dada una recta L y dos puntos P y Q, situados en 
lados opuestos de L (Fig. 182), hállese un punto: R de L, tal que 
|p — q |, es decir, el valor absoluto de la diferencia de las distancias 
de P y Q a R sea máximo. (Supondremos que L no es la mediatriz 
de PQ, pues entonces, p — q sería igual a cero para cualquier punto 
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R de L y el problema carecería de interés.) Para resolverlo, hallemos 
primero el simétrico de P respecto a L, obteniendo el punto P”, del 
mismo lado de L que Q. Para cualquier punto R’ de L, se tiene: 
p = R'P = R' P’, q = R'Q. Puesto que R’, Q y P” pueden conside- 
rarse como los vértices de un triángulo, | p — q | = |R'P' — R'Q | 
nunca será mayor que P“Q, 
pues la diferencia entre dos 
lados de un triángulo nunca 
excede al tercer lado. Si R’, P’ 
y Q están sobre la misma recta, 
Ip ql será igual a PQ, 
como se deduce de la figura. 
En consecuencia, el punto R 
buscado es la intersección de L 
con la recta que une P con Q. 
Como en el caso anterior, es Fic. 182.—} PR — QR | = máximo. 
fácil ver que los ángulos que 

forman RP y RQ con L son iguales, ya que los triángulos RPR' y 
y -RP'R' son congruentes. 

Este problema está relacionado con una propiedad de la tan- 
gente a la hipérbola, en igual forma que el anterior lo estaba con la 
tangente a la elipse. Si la diferencia máxima | PR — QR- | tiene el 
valor 2a, cabe considerar el lu- 
gar geométrico de todos los 
puntos del plano para los cuales 

R p — q tiene el valor absoluto 2a; 

es decir, la hipérbola de focos 

P y Q que pasa por el punto R. 

Es fácil ver que el valor abso- 

Q L luto de p — q es menor que 2a 

en la región situada entre las 

dos ramas de la hipérbola y 

Fide 183, Pa cos do 1a tangente mayor que 2a en el lado de 
cada rama donde está situado 

el foco correspondiente. Por un razonamiento esencialmente idén- 
tico al utilizado para la elipse, se deduce que L debe ser tangen- 
te a la hipérbola en R. De la situación de P o Q, esto es, de su mayor 
o menor distancia a L, depende que esta recta sea tangente a 
una u otra rama de la hipérbola; si P está más cerca, la rama que 
rodea P tocará a L, y lo mismo para Q (Fig. 183). Si P y Q equidistan 
de L, entonces ésta no tocará a ninguna de las dos ramas de la hi- 
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pérbola, sino que será una de las asíntotas de la curva. Este resultado 
es evidente si se observa que en tal caso la construcción precedente 
no proporcionará ningún punto R (a distancia finita), ya que la recta 
P'Q es paralela a L. 

Como en los casos anteriores, este razonamiento prueba el teore- 
ma bien conocido: la tangente a una hipérbola en cualquier punto 
de ella es bisectriz del ángulo subtendido en dicho punto por los focos. 

Podrá parecer extraño que tengamos que resolver un problema 
de mínimo cuando P y Q se encuentran del mismo lado de L, mien- 
tras que, si están a distinto lado, se transforma en un problema de 
máximo. Esto es natural, por la siguiente causa: en el primer pro- 
blema, cada una de las distancias p y q, y, por tanto, su suma, llega 
a exceder a cualquier límite prefijado, a medida que nos movemos 
a lo largo de L, en cada una de las dos direcciones posibles. De ahí 
que sea imposible encontrar un valor máximo para p + q, siendo un 
problema de mínimo la única posibilidad. Es enteramente distinto lo 
que ocurre en el segundo caso, cuando P y Q se encuentran a distinto 
lado de L. Aquí, para evitar confusiones, debemos distinguir entre 
el valor de la diferencia p — q, su opuesto q — p, y el valor absoluto 
|p — q |, siendo este último el que puede ser máximo. Se entenderá 
mejor esto si hacemos que el punto R se mueva a lo largo de L, adop- 
tando distintas posiciones Ry, Ra, Rs, ... Existe un punto para el cual 
la diferencia p — q es cero: la intersección de la mediatriz de PQ 
con L. Por consiguiente, este punto corresponde a un minimo del 
valor absoluto | p — q |. Pero, a un lado de este punto p es mayor 
que q, y en el otro, menor, de donde resulta que p — q es positiva 
a un lado de ese punto y negativa al otro. En consecuencia, la propia 
diferencia p — q no es ni máxima ni mínima en el punto para el cual 
|p — q | =0. Sin embargo, el punto que hace máximo a | p — q | es 
realmente un valor extremo de p — q. Si p > q, se tendrá un máximo 
para p — q; si q > p resultará un máximo para q — p; O sea, un 
mínimo para p — q. El que exista máximo o mínimo para p — q 
queda determinado por la posición de los dos puntos dados, P y Q, 
respecto a la recta L. 

Hemos visto que no existe solución para el problema de máximo 
si los puntos P y Q equidistan de L, pues entonces, como se observa 
en la figura 182, P'Q es paralela a L. Esto corresponde al hecho de 
que la cantidad | p — q | tiende a un límite, cuando R tiende a infi- 
nito a lo largo de L, en cualquiera de las dos direcciones posibles. 
Este valor límite es la longitud de la proyección ortogonal s de PQ 
sobre L (el lector puede demostrarlo como ejercicio). Si P y Q equi- 
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distan de L, entonces |p — q | será siempre menor que ese límite, 
no pudiendo existir máximo, puesto que, para todo punto R, se puede 
encontrar otro más alejado y tal que el valor correspondiente de 
| p — q | sea mayor, pero todavía inferior a s. 

*5. Distancias extremales a una curva dada.—Determinaremos, en 
primer lugar, las distancias mínima y máxima de un punto P a una 
curva dada C. Para mayor sencillez, supongamos que C es una cur- 
va simple cerrada (Fig. 184) con tangente en cada punto. (Acepta- 
mos aquí el concepto intuitivo de tangente a una curva, el cual será 
analizado en el próximo capítulo.) La respuesta es muy sencilla: un 
punto R, situado en la curva C, para el cual la distancia PR sea 
máxima o mínima, debe ser tal que la recta PR sea perpendicular 
a la tangente a C en R; en otras palabras, PR debe ser perpendicular 
a C. La demostración es la siguiente: la circunferencia de centro P, 
que pasa por R, debe ser tangente a la curva. Pues si R es el punto 
de distancia mínima, C ha de / 
encontrarse por completo fuera 
del círculo y, en consecuencia, 
no puede cortar a su circunfe- 
rencia en R; por otra parte, si R 
es el punto de distancia máxima, 
C debe ser interior a la circun- 
ferencia, por lo que tampoco en 
este caso puede cortarla en R. 
(Esto se deduce de un hecho 
evidente: la distancia de cual- 
quier punto a P es menor que 
RP si el punto es interior al círculo, y mayor que RP si es exterior.) 
De todo ello resulta que la circunferencia y la curva C se tocarán y 
tendrán una tangente común en R, Ahora bien: por ser la recta PR 
un radio de la circunferencia, será perpendicular a su tangente en 
R y, en consecuencia, perpendicular a C en R. 

Resulta, además, que el diámetro de una curva cerrada C, es decir, 
su cuerda máxima, debe ser perpendicular a C en ambos extremos. 
La demostración queda a cargo del lector, como ejercicio. Una afirma- 
ción similar puede formularse y demostrarse para tres dimensiones. 





Fic. 184. — Distancias extremales a una curva. 


Ejercicio: Demuéstrese que los segmentos máximo y mínimo, que unen dos 
curvas cerradas que no se cortan, son perpendiculares a las mismas en sus puntos 
extremos. 

Pueden generalizarse ahora los problemas del número anterior, 
referentes a la suma o diferencia de distancias. En lugar de una recta L 
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consideremos una curva simple cerrada C, con tangente en cada 
punto, y dos puntos, P y Q, no situados sobre ella. Deseamos carac- 
terizar los puntos de C, para los cuales la suma p + q y la diferencia 
p — q toman valores extremos, designando por p y q las distancias 
de un punto cualquiera de C a P y Q, respectivamente. No es posi- 
ble utilizar aquí las sencillas construcciones de simetría de que nos 
servimos cuando C era una recta, pero podemos utilizar las propie- 
dades de la elipse y de la hipérbola para resolver estos problemas. 
Puesto que C es una curva cerrada y no una recta indefinida, ahora 
tiene sentido plantearse ambos problemas, el de máximo y el de mí- 
nimo, pues puede suponerse que p + q y p — q toman dos valores, 
máximo y mínimo, sobre cualquier arco finito de curva, en particu- 
lar sobre una curva cerrada (véanse págs. 376 y siguientes). 

En el caso de la suma, p + q, supongamos que R es el punto de C 
para el cual p + q es máximo y sea 2a el valor de p + q en R. Consi- 
deremos la elipse de focos P y Q, lugar geométrico de todos los pun- 
tos tales que p + q = 2a. Esta elipse ha de ser tangente a C en R 
(la demostración queda a cargo del lector, como ejercicio). Pero hemos 
visto ya que las rectas PR y QR forman ángulos iguales con la elipse 
en R, y como ésta es tangente a C en R, las rectas PR y QR deben 
formar también ángulos iguales con C en R. Si p+ q es mínimo 
para R, se ve, de forma análoga, que PR y QR forman ángulos igua- 
les con C en R. Tenemos así este teorema: Se da una curva cerrada C 
y dos puntos P y Q situados del mismo lado de C; en un punto R 
de C, en el cual la suma p + q toma su valor máximo o mínimo, las 
rectas PR y QR forman ángulos iguales con la curva C (es decir, con 
su tangente) en R. 





Fic, 185.— Valores máximo y mínimo Fic. 186. —Mínimo de PR — QR. 
de PR + QR. 
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Si P es interior a C, y Q exterior, el teorema sigue subsistiendo 
para el valor máximo de p + q, pero ya no se cumple para el míni- 
mo, puesto que la elipse degenera en un segmento de recta. 

Por un proceso análogo, utilizando las propiedades de la hipér- 
bola en lugar de las de la elipse, el lector podrá demostrar el siguiente 
teorema: Dada una curva cerrada C y dos puntos P y Q, separados 
por C, existe un punto R de C en el cual p — q toma un valor máxi- 
mo o mínimo, y las rectas correspondientes PR y QR forman ángu- 
los iguales con C. Debemos insistir una vez más en que el problema 
es distinto para una curva cerrada que para una línea indefinida, 
puesto que en este último caso se buscaba el máximo del valor abso- 
luto | p — q |, mientras que ahora existe un máximo (y también un 
mínimo) de p — q. 


*II. UN PRINCIPIO GENERAL ACERCA 
DE LOS PROBLEMAS DE VALORES EXTREMOS 


1. El principio.—Los problemas precedentes son ejemplos de una 
cuestión. general, para cuya mejor formulación conviene utilizar el 
lenguaje analítico. En el problema de hallar los valores extremos de 
p + q, representemos por x e y las coordenadas del punto R; me- 
diante zı, y1, las del punto fijo P, y por xz, ya, las de Q, con lo que 


PpP=V @-— a} +U- y, q = V (x — 23)? + (y — ya), 


y el problema queda reducido al de determinar los valores extremos 
de la función 
iz, y) =P +4- 


Esta función es continua en todo el plano, pero el punto cuyas coorde- 
nadas son x, y ha de estar situado sobre la curva C, que vendrá defi- 
nida por una ecuación g(x, y) = 0; p. ej., 12 + y2 — 1 =0, si se 
trata de la circunferencia unidad. El problema cónsiste ahora en 
encontrar los valores extremos de f(x, y), cuando x e y están sujetos 
además a la condición g(x, y) =0. En lo que sigue, estudiaremos 
este tipo general de problema. 

Para caracterizar las soluciones, consideremos la familia de cur- 
vas definidas por la ecuación f(x, y) = c, donde c puede tomar cual- 
quier valor, el mismo para todos los puntos de cada curva de la fami- 
lia. Supongamos que por cada punto del plano pasa una, y sólo una, 
de las curvas de la familia f(x, y) = c; al menos, si nos limitamos a 
los puntos situados en la proximidad de la curva C. Entonces, al 
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variar c, la curva f(x, y) = c barrerá una parte del plano, sin pasar 

dos veces por un mismo punto de esta región. (Las curvas z? — y2=c, 

x +y =c¢ yx =c son familias de ese tipo.) En particular, una curva 

de la familia pasará por 

Ri, donde f(x, y) toma su 

valor máximo en C, y 

otra pasará por el punto 

Fay)=a Re, donde f(x, y) toma su 

R: valor mínimo. Llamemos 

a al máximo y b al mini- 

mo. A un lado de la 

curva f(x, y) = a, el valor 

de f(x, y) será menor que 

a, y del otro lado, mayor 

FiG. 187. — Valores extremos: de una función sobre pS e 

contrarse enteramente a 

un lado de la curva f(x, y) = a, por lo que debe ser tangente a ella 

en R¡. Análogamente, C debe ser tangente a la curva f(x, y) = b 

en Rz. Tenemos así el teorema general: si en un punto R de una curva 

C, una función f(x, y) tiene un valor extremo a, la curva Î(x, y) = a es 
tangente a C en R. 

2. Ejemplos.—Es fácil ver que los resultados anteriores son casos 
especiales de este teorema general. Si p + q ha de tomar un valor 
extremo, la función f(x, y) es p + q, y las curvas f(x, y) = e son elipses 
homofocales, de focos P y Q. Como prevé el teorema general, las elip- 
ses que pasan por los puntos de C, donde f(x, y) toma sus valores 


O) 


FrG. 188.— Elipses homofocales. Frc. 189.— Hipérbolas homofocales. 


F(uy)=0 
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extremos, serán tangentes a C en dichos puntos. Cuando se buscan 
los valores extremos de p — q, la función f(x, y) es p — q, y las cur- 
vas f(x, y) =c son hipérbolas homofocales, de focos P y Q, y las 
hipérbolas que pasan por los puntos que dan valores extremos a 
f(x, y) son tangentes a C. 
Otro ejemplo es el siguiente: dado un segmento PQ y una recta L, 
que no lo corta, ¿desde qué punto de L subtenderá PQ un ángulo 
- máximo? 
La función cuyo máximo se busca es el ángulo 0 que forman los 





FıG. 190. — Punto de L, desde el que se ve bajo ángulo máximo el segmento PQ. 


extremos de PQ con diferentes puntos de L. El ángulo formado por 
PQ con cualquier punto R del plano es una función 0 = f(x, y) de 
las coordenadas de R. Por geometría. elemental, sabemos que la fa- 
milia de curvas 9 = f(x, y) = c es el haz de circunferencias que pasan 
por P y Q, puesto que una cuerda de un círculo subtiende el mismo 
ángulo para todos los puntos de la circunferencia del mismo lado de 
la cuerda. Como puede verse en la figura 190, dos de esas circunfe- 
rencias serán en general tangentes a L, estando sus centros a dis- 
tinto lado de PQ. Uno de esos puntos de tangencia proporciona el 
máximo absoluto de 0, mientras que el otro corresponde a un máximo 
«relativo» (es decir, el valor de 0 será, en un cierto entorno de este 
punto, menor que en el propio punto). El mayor de ambos máximos, 
el máximo absoluto, está dado por el punto de tangencia que se en- 
cuentra en el ángulo agudo formado por la prolongación de PQ y 
L; y el menor, por el punto situado en el ángulo obtuso formado 


352 MÁXIMOS Y MÍNIMOS [cap. 7 











por estas dos rectas. (El punto donde la prolongación de PQ corta 
a L proporciona el valor mínimo de 6, o sea, cero.) 

Para generalizar este problema, podemos reemplazar L por una 
curva C y tratar de determinar el punto.R de C, tal que un segmento 
dado PQ (que no corta a C) subtienda un ángulo máximo o mínimo. 
También en este caso la circunferencia que pasa por P, Q y R debe 
ser tangente a C en R. 


III. LOS PUNTOS ESTACIONARIOS Y EL CÁLCULO DIFERENCIAL 


1. Extremos y puntos estacionarios.—Hasta aquí no hemos hecho 
uso de la técnica del cálculo diferencial. En realidad, nuestros métodos 
elementales son mucho más sencillos y directos que los del cálculo. 
Por regla general, en el pensamiento científico, es mejor considerar 
los rasgos peculiares de un problema que fiarse exclusivamente de los 
métodos generales, aunque los esfuerzos individuales deban guiarse 
siempre por un principio que aclare el significado de los procedi- 
mientos especiales utilizados. Éste es precisamente el papel que des- 
empeña el cálculo diferencial en los problemas de máximos y míni- 
mos. El ansia moderna por la generalización representa sólo un as- 
pecto de los hechos, pues la vitalidad de la matemática depende pri- 
mordialmente del matiz individual de los problemas y métodos. 

En su desarrollo histórico, el cálculo diferencial fué intensamente 
influído por los problemas particulares de máximos y mínimos. La 
conexión entre éstos y el cálculo diferencial se produce de la siguiente 
manera. En el capítulo VIII haremos un estudio detallado de la deri- 
vada f'(x) de una función f(x), y de su significado geométrico. En 
pocas palabras, la derivada f'(x) es la pendiente de la tangente a la 
curva y = f(x) en el punto (x, y). Geométricamente, es evidente que 
en un máximo o mínimo de una curva continua y = f(x), la tangente 
a la misma debe ser horizontal; es decir, su pendiente igual a cero. 
Así se obtiene la condición f'(x) = 0, que han de cumplir los valores 
extremos de f(x). 

Para comprender lo que significa la anulación de f'(x), examine- 
mos la curva de la figura 191. Existen cinco puntos A, B, C, D y E 
en los cuales la tangente a la curva es horizontal; designemos por a, 
b, c, d y e los valores de f(x) en dichos puntos. El máximo de f(x) en 
el intervalo representado se encuentra en D, y el mínimo, en A. El 
punto B representa también un máximo en el sentido de que para 
todos los puntos en la proximidad inmediata de B, f(x) es menor que b, 
aunque f(x) es mayor que b para los puntos que se encuentran cerca 
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de D. Por esta razón, se dice que B es un máximo relativo de f(x‘) 
mientras que D es el máximo absoluto. Análogamente, C representa 
un mínimo relativo, y A, el mínimo absoluto. Finalmente, en E no 
tiene f(x) ni máximo ni mínimo, aunque f'(x) = 0. De ahí se deduce 
que la anulación de f'(x) es una condición necesaria, pero no sufi- 
ciente, para que exista un valor extremo de una función derivable 





FiG. 191.—Puntos estacionarios de una función. 


/(c); en otras palabras, para cualquier valor extremo, relativo o abso- 
luto, debe ser f'(x) = 0; pero no en todo punto donde se anula la 
derivada existe necesariamente un valor extremo de la función. Un 
punto donde se anula la derivada se llama punto estacionario, sea 
valor extremo o no. Mediante un análisis más profundo, se pueden 
establecer condiciones más o menos complicadas, en las que se tienen 
en cuenta las derivadas de orden superior de f(x), que caracterizan 
por completo los máximos, mínimos y otros puntos estacionarios. 

2. Máximos y mínimos de las funciones de varias variables. Pun- 
tos de ensilladura.—Existen problemas de máximos y mínimos que 
no pueden expresarse por medio de una función f(x) de una sola va- 
riable. Entre ellos, el más sencillo es el de hallar los extremos de una 
función z = f(x, y) de dos variables. 

Podemos representar f(x, y) por la cota z de una superficie sobre 
el plano x, y, lo que permite una interpretación, por decirlo así, de 
geografía de montaña. Un máximo de f(x, y) corresponde a un pico; 
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un mínimo, al fondo de una depresión o de un lago. En ambos casos, 
si la superficie no es accidentada, su plano tangente será horizonta). 
Pero existen otros puntos, además de los picos y de las depresiones, 
en los cuales el plano tangente es horizontal: son los puntos que repre- 
sentan los pasos de vertiente o puertos, que vamos a examinar con 
más detalle. Consideremos, como en la figura 192, dos montañas, A 
y B, que forman parte de una cordillera y dos puntos, C y D, a dife- 
rentes lados de la misma; supongamos que se desea ir de Ca D. Vea- 
mos primero los caminos que conducen de C a D, obtenidos cortando 
la superficie por un plano que pasa por ambos puntos; cada uno de 
estos caminos tendrá un punto más alto, Variando la posición del 
plano cambia el camino, y existirá uno, CD, para el cual la altitud 





Fra. 192. — Puerto o paso Fic. 193. —Su correspondiente 
de montaña. mapa de curvas de nivel. 


de su punto más elevado es mínima. El punto E de máxima altitud 
de ese camino es un paso de montaña o puerto, que en lenguaje ma- 
temático llamaremos punto de ensilladura. Es evidente que. E no es 
ni máximo ni minimo, puesto que tan próximos a él como queramos, 
podemos encontrar puntos que son más altos o más bajos que E. En 
lugar de limitarnos a considerar los caminos planos, podemos tener 
en cuenta otros cualesquiera, prescindiendo de esa restricción. Sin 
embargo, la caracterización del punto E sigue siendo la misma. 
Análogamente, si queremos pasar del pico A al B, cualquier ca- 
mino que se considere tendrá un punto de mínima altitud; si conside- 
ramos otra vez exclusivamente secciones planas, existirá un recorrido 
AB tal que su punto más bajo sea el más elevado de todos, por Jo 
que, para esta trayectoria, el mínimo se encuentra de nuevo en el pun- 
to E anterior. Este punto de ensilladura E tiene la propiedad de ser el 
mínimo superior o el máximo inferior, es decir, es un maxi-minimo 
o un mini-máximo El plano tangente en E es horizontal; como E es 
el mínimo de AB, la tangente AB en E debe ser horizontal, y, aná- 
logamente, puesto que E es el máximo de CD, la tangente a CD en 
E ha de serlo también. En consecuencia, el plano tangente, que está 
determinado por esas rectas, es horizontal. Encontramos así tres tipos 
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diferentes de puntos, cuyos planos tangentes son horizontales; máxi- 
mos, mínimos y puntos de ensilladura, a los cuales corresponden los 
diferentes tipos de valores estacionarios de f(x, y). 

Otro método de representar una función f(x, y) consiste en dibu- 
jar curvas de nivel, tales como las que se utilizan en los mapas alti- 
métricos (véase pág. 298). Una curva de nivel es una curva del. plano 
x, y, a lo largo de la cual la función f(x, y) tiene un valor constante; 
es decir, las curvas de nivel coinciden con las curvas de la familia 
f(x, y) = c. Por un punto ordinario del plano pasa una curva de nivel 
y sólo una, mientras que un máximo o mínimo está rodeado por cur- 
vas de nivel cada vez más cerradas, y en un punto de ensilladura se 
cruzan varias de ellas. En la figura 193 se han dibujado las curvas 
de nivel correspondientes al esquema de la figura 192, siendo evi- 
dente la propiedad del punto E de ser maxi-mínimo: cualquier camino 
que una A con B y que no pase por E ha de atravesar una región en la 
cual f(x, y) < f(E), mientras que el camino AEB de la figura 192 tie- 
ne un mínimo en E. De la misma manera, se ve que el valor de f(x, y) 
en E es el menor máximo para todos los caminos que unen C con D. 

3. Puntos mínimos y topología. 
la teoría general de los puntos estacionarios y los conceptos topológi- 
cos. Sólo podemos dar aquí una 
indicación muy breve de esas 
ideas, refiriéndonos a un ejem- 
plo muy sencillo, 

Consideremos un paisaje 
montañoso en una isla (figu- 
ra 194) en forma de anillo, con 
sus dos contornos C y C’. Si 
representamos la altura sobre el 
nivel del mar por u = f(x, y), 
con f(x, y =0 en C y C, y . 

[(=, y) > 0 en el interior de la "en doblemente conexa. > 07 
isla, debe existir al menos un 

paso o puerto en ésta, según aparece en la figura 194, representado por 
el punto donde se cruzan las líneas de nivel. Intuitivamente es posi- 
ble ver esto si se intenta ir de C a Ç’ de modo que el camino no pase 
por ningún punto de altitud mayor que la necesaria. Cada camino 
dė C a C' debe tener un punto de altura máxima, y si elegimos el 
camino cuyo punto de máxima altitud sea lo más bajo posible, el pun- 
to más alto de este recorrido es un punto de énsilladura de u=((x, y). 
(Existe una excepción trivial, cuando un plano horizontal es tan- 
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gente a la cresta montañosa alrededor de todo el anillo.) Para un 
dominio limitado por p curvas, deben existir, en general, p — 1 pun- 
tos estacionarios del tipo estudiado. Marston Morse ha descubierto 
que esas mismas relaciones son válidas para mayor número de di- 
mensiones, donde existe más variedad de posibilidades topológicas 
y de tipos de puntos estacionarios. Esas relaciones constituyen la 
base de la moderna teoría de los puntos estacionarios. 

4. Distancia de un punto a una superficie.—Para la distancia entre 
un punto P y una curva cerrada existen (al menos) dos valores esta- 
cionarios: un máximo y un mínimo. No surge ningún hecho nuevo 
si intentamos generalizar este resultado a tres dimensiones, en tanto 
que consideremos una superficie C topológicamente idéntica a una 


P 





Fig. 195. Fic. 196. 


esfera; p. ej., un elipsoide. Pero se presenta una situación distinta si 
la superficie es de género superior; p. ej., un toro. Existe siempre una 
distancia máxima y otra mínima, de P al toro C, siendo ambos seg- 
mentos perpendiculares a C; pero, además, encontramos valores extre- 
mos de diferentes tipos, que son mínimos de máximos o máximos de 
minimos. Para ello tracemos en el toro una «meridiana» cerrada, la 
circunferencia L (Fig. 195), tratando de encontrar el punto Q de L 
que se encuentre más próximo a P. Después, trasladamos L de modo 
que la distancia PQ sea: a) un mínimo (este Q es simplemente el punto 
de C que se encuentra más cerca de P); b) un máximo (éste nos pro- 
porciona otro punto estacionario). También podemos determinar el 
punto de L que se encuentra más alejado de P, determinando des- 
pués L de modo que esta distancia máxima sea: e) un máximo (que 
se alcanzará en el punto C más alejado de P); d) un mínimo. Obte- 
nemos así cuatro valores estacionarios diferentes de la distancia. 


Ejercicio: Repítase el razonamiento anterior para otro tipo L” de curva ce- 
rrada sobre C que no pueda reducirse a un punto, como en la figura 196, 
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IV. EL PROBLEMA DEL TRIÁNGULO DE SCHWARZ 


1. La demostración de Schwarz.—Hermann Amandus Schwarz 
(1843-1921) fué un notable matemático de la Universidad de Berlín 
y uno de los que más han contribuido a la moderna teoría de funcio- 
nes y al análisis, No desdeñaba ocuparse de asuntos elementales y 
una de sus memorias trata del siguiente problema: dado un triángulo 
acutángulo, inscribirle otro de perímetro mínimo. (Entendemos por 
triángulo inscrito cualquiera cuyos vértices se encuentran respectiva- 
mente en cada uno de los lados del primer triángulo.) Veremos que 
existe exactamente un triángulo que cumple dicho requisito y que 
sus vértices coinciden con los pies de las alturas del dado. Le llama- 
remos triángulo órtico. 

Schwarz demostró esta propiedad del triángulo órtico de tener el 
perímetro mínimo mediante el método de reflexión, sirviéndose ade- 
más del siguiente teorema de geometría elemental (Fig. 197): en cada 
uno de los vértices P, Q, R los 
dos lados correspondientes del 
triángulo órtico forman ángulos 
iguales con los del primitivo; 
estos ángulos son iguales al del 
vértice opuesto del triángulo 
original; p. ej., los ángulos ARQ 
y BRP son ambos iguales al 
C, ete. 

Para demostrar este teore- A R B 
ma preliminar, observemos que — FS; 107. Triángulo ártico del 4 BCs se 
OPBR es un cuadrilátero ins- 
criptible, puesto que OPB y ORB son ángulos rectos. En consecuen- 





cia, PBO = PRO, ya que subtienden el mismo arco PO en la cir- 
cunferencia circunscrita; pero PBO es complementario de €, por ser 
CBQ un triángulo rectángulo, y PRO es complementario de PRB. 
En consecuencia, este último es igual a C. De la misma manera, utili- 


zando el cuadrilátero QORA, veríamos que GRA = E, etc. 

Este resultado nos permite enunciar la siguiente propiedad del 
triángulo órtico: dado que, p. ej., AQR = CQP, la simétrica de RQ 
respecto a AC es la prolongación de PQ, y viceversa; lo mismo sucede 
para los otros lados. 
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Demostraremos ahora la propiedad de mínimo del triángulo órtico. 
En el triángulo ABC consideremos, además del órtico, cualquier otro 
triángulo inscrito, UVW. Reflejemos toda la figura primero sobre el 
lado AC de ABC; después repitamos la operación con el triángulo 
resultante sobre su lado A B, después sobre BC, de nuevo, sobre AC y, 





Fic. 198. — Demostración de Schwarz de que el triángulo órtico es el 
de perímetro mínimo. 


finalmente, sobre AB. De esta manera obtenemos en total seis trián- 
gulos congruentes. El lado BC del último triángulo es paralelo al 
primitivo lado BC, pues, en la primera simetría, BC gira en el sen- 
tido de las agujas de un reloj un ángulo 2C; después, en el mismo sen- 
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tido, un ángulo 2B; en la tercera simetría no experimenta ningún 
cambio; en la cuarta, gira un ángulo 2C en sentido contrario al de 
las agujas de un reloj, y en la quinta, un ángulo 2B en igual sentido, 
de donde resulta que el ángulo total girado es cero. 

Debido a esta propiedad del triángulo órtico, el segmento PP” es 
igual a dos veces el perímetro de dicho triángulo; pues PP” se com- 
pone de seis trozos que son, respectivamente, iguales al primero, 
segundo y tercer lados del triángulo, apareciendo cada uno dos veces. 
Análogamente, la línea quebrada de U a U’ es igual al doble del 
perímetro del otro triángulo inscrito y no es más corta que el seg- 
mento UU”, Puesto que éste es paralelo a PP”, la quebrada de U 


c c 


A R B A R B 
Fic. 199. Fic. 200. 


a U’ no es más corta que PP’; luego el perímetro del triángulo órtico 
es el menor posible de todos los triángulos inscritos, según se preten- 
día demostrar. Así hemos deducido al mismo tiempo que existe un 
mínimo y que está dado por el triángulo órtico. Después demostra- 
remos que no existe ningún otro triángulo de perímetro igual al órtico. 

2. Otra demostración. —Tal vez la solución más sencilla del teo- 
rema de Schwarz sea la que se da a continuación, basada en el teore- 
ma antes demostrado de que la suma de las distancias de dos puntos 
dados, P y Q, a una recta L, es mínima para un punto R de L tal 
que PR y QR forman ángulos iguales con L, siempre que P y Q se 
hallen al mismo lado de L y ninguno de ellos esté sobre la recta. 
Supongamos que el triángulo PQR, inscrito en el ABC, es la solución 
del problema de mínimo enunciado. Entonces R debe ser un punto- 
del lado AB tal que p + q sea mínimo y, por tanto, los ángulos ARQ 


y BRP deben ser iguales. Análogamente, se tendrá: ÁQR = COP, 


BPR = CPQ. Así, pues, si existe el triángulo de perímetro mínimo, 
ha de verificarse además la igualdad de ángulos utilizada en la de- 
mostración de Schwarz. Queda por probar que el único triángulo que 
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posee tal propiedad es el órtico. Además, puesto que en el teorema 
en que se basa esta demostración se supone que P y Q no están sobre 
la recta AB, el razonamiento deja de ser válido cuando uno de los 
puntos P, Q o R es un vértice del triángulo primitivo (en cuyo caso, 
el triángulo de perímetro mínimo degeneraría en el doble de la altura 
correspondiente). Para completar la demostración debemos probar 
que el perímetro del triángulo órtico es menor que el doble de cual- 
quiera de las alturas. 


Para resolver el primer punto observemos que si un triángulo 
inscrito tiene la propiedad antes mencionada, los ángulos en los vér- 


tices P, Q y R deben ser iguales a Â, B, C, respectivamente. Pues si 


suponemos, p. ej., ARQ = C + 8, como la suma de los ángulos de 
un triángulo es 1800, el ángulo en Q debe ser igual a B — 8 y el án- 
gulo en P, igual a A — 8, 
para que los ángulos de los 
triángulos ARQ y BRP den 
sumas iguales a 1800. Pero 
la suma de los ángulos del 
triángulo CPQ es igual a 
A—3+B—8+C=1800—23, 
y como esta suma ha de ser 
igual a 1800, necesariamente 
debe ser 3 = 0. Hemos visto 
ya que el triángulo órtico 
tiene esta propiedad de la 
igualdad de ángulos. Cual- 
quier otro triángulo que po- 
Fic. 201. sea la misma propiedad ha- 
brá de tener sus lados pa- 
ralelos a los correspondientes del triángulo órtico; en otras palabras, 
sería semejante a él y estaría orientado de la misma manera. El lec- 
tor demostrará que en un triángulo dado no puede inscribirse otro 
triángulo cumpliendo tal requisito (Fig. 200). 

Finalmente, demostraremos que el perímetro del triángulo órtico 
es menor que el doble de cualquiera de las alturas, siempre que los 
ángulos del triángulo primitivo sean todos agudos. Prolonguemos los 
lados QP y QR y tracemos las perpendiculares desde B a QP, QR 
y PR, obteniendo así los puntos L, M y N. Entonces, QL y QM 
serán, respectivamente, las proyecciones de la altura QB sobre QP y 
QR. En consecuencia, QL + QM < 20B. Pero QL + QM es igual a p, 
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perímetro del triángulo órtico, pues los triángulos MRB y NRB son 
congruentes, por tener iguales los ángulos MRB y NRB y ser rectos 
los ángulos M y N. De aquí se deduce que RM = RN; en consecuen- 
cia, QM =QR + RN. De la misma manera vemos que PN = PL, 
por lo que QL = QP + PN. Tenemos, por tanto, QL + QM =QP+ 
+QR + PN + NR =QP +0QR + PR = p. Pero como hemos de- 
mostrado ya que 2QB > QL + QM, resulta que p es menor que el 
doble de la altura QB. Con el mismo razonamiento puede demostrarse 
que p es menor que el doble de cualquier otra altura, con lo cual 
queda completamente establecida la propiedad de mínimo del trián- 
gulo órtico. 


Además, la construcción precedente permite calcular directamente p. Sabe- 

mo AN 

mos que los ángulos PQC y RQA son iguales a B, por lo que PQB=RQB=90-—B, 
An KN 


o sea: cos (PQB) = sen B. En consecuencia, por trigonometría elemental, se de- 
duce que QM = QL = QB sen B y p = 2QB sen B. De igual forma se demuestra 
que p=2PA sen A =2RC sen C. También por trigonometría sabemos que 
RC = asen B = b sen A, etc., de donde resulta: p = 2a sen B sen C = 2b sen C 
sen A = 2c sen A sen B. Finalmente, puesto que a = 2rsen A, b = 2r sen B, 
c = 2r sen C, siendo r el radio del círculo circunscrito, obtenemos la expresión 
simétrica p = 4r sen A sen B sen C. 


3. Triángulos obtusángulos.—En las dos demostraciones anteriores, 
se ha supuesto que los ángulos A, B y C eran agudos. Si, p. ej., C es 
obtuso (Fig. 202), los puntos P y Q se encontrarán fuera del triángulo. 
En consecuencia, no pue- 
de ya decirse estrictamen- 
te que el triángulo órtico 
esté inscrito en el triángu- 
lo, a menos que entenda- 
mos por triángulo inscrito 
aquel cuyos vértices se en- 
cuentren sobre los lados o 
sus prolongaciones. En to- 
do caso, el perímetro del 
triángulo órtico ya no 
es mínimo, puesto que 
PR > CR y QR > CR, de donde se deduce que p = PR + QR + 
+ PQ > 2CR. Puesto que del razonamiento de la primera parte de 
la demostración anterior se desprendía que el perímetro mínimo, si 
no estaba dado por el triángulo órtico, debía ser igual al doble de 
una de las alturas, concluímos que en los triángulos obtusángulos, el 
«triángulo inscrito» de perímetro mínimo es la altura menor contada 








Fic. 205 Trineo órtico de un triángulo 
obtusángulo. 
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dos veces; aunque no sea un triángulo propiamente dicho. Además, 
es posible encontrar un verdadero triángulo cuyo perímetro difiera 
tan poco como queramos del doble de la altura. Para el caso. límite, 
el triángulo rectángulo, coinciden las dos soluciones: el doble de la 
altura menor y el triángulo órtico. 

No podemos entrar a discutir aquí la interesante cuestión de saber 
si el triángulo órtico posee propiedades extremales para los triángulos 
obtusángulos. Nos limitaremos sólo a decir que el triángulo órtico nos 
proporciona, no un mínimo para la suma de los lados p+ q +r, sino un 
valor estacionario de tipo mini-máximo para la expresión p + q — T, 
donde r es el lado del triángulo inscrito opuesto al ángulo obtuso. 

4. Triángulos formados por rayos luminosos.—Si el triángulo A BC 
representa una cámara cuyas paredes pueden reflejar la luz, el tri- 
ángulo órtico es la única trayectoria luminosa triangular posible. No 

se excluyen otras trayectorias po- 
ligonales, según muestra la figu- 
ra 203, pero el triángulo órtico es 

la única poligonal de tres lados. 
Podemos generalizar este pro- 
blema preguntándonos cuáles son 
los «triángulos luminosos» posibles 
en un dominio arbitrario limitado 
por una o varias curvas continuas; 
p. ej., deseamos encontrar los tri- 
ángulos con vértices situados sobre 
l las curvas del contorno y tales qu. 
Fre. O Trayectoria luminosa en elin- cada dos lados adyacentes formen 
el mismo ángulo con la curva. 
Según hemos visto en la página 342, la igualdad de los ángulos e 
condición necesaria para que exista tanto un máximo como un míni- 
mo de la longitud total de los dos lados, por lo que, de acuerdo co: 
las circunstancias, podremos encontrar diferentes tipos de triánguios 
luminosos. Así, p. ej., si consideramos el interior de una curva continua 
única C, el triángulo inscrito de longitud máxima debe ser un trián- 
gulo luminoso. O podemos considerar (como nos lo sugiere Marston 
Morse) el exterior de tres curvas continuas cerradas. Un triángulo 
luminoso ABC puede caracterizarse por el hecho de que su longitud 
tenga un valor estacionario; éste puede ser un mínimo respecto a los 
tres puntos A, B, C, o respecto a cualquiera de las combinaciones, 
como A y B, y un máximo respecto al tercer punto C, o puede ser 
un mínimo respecto a un punto y máximo respecto a los otros dos, 
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o, finalmente, ser un máximo respecto a los tres puntos. En cual- 
quier caso, está asegurada la existencia de, por lo menos, 23 = 8 


Fics. 204-7.— Los cuatro tipos de triángulos luminosos entre tres círculos. 
triángulos luminosos, puesto que para cada uno de los tres puntos, 
independientemente, es posible un máximo o un mínimo. 

*5. Observaciones relativas a los problemas de reflexión y al movi- 
miento ergódico.—Es un problema de especial interés en dinámica y 
en óptica describir el recorrido o trayectoria de una partícula en el 
espacio, o de un rayo luminoso durante un intervalo ilimitado de 
tiempo. Si mediante algún artificio físico la partícula o el rayo están 
restringidos a una porción limitada del espacio, es del mayor interés 
saber si la trayectoria acabará, en el límite, por llenar todos los pun- 
tos del espacio con una distribución aproximadamente uniforme. Una 
trayectoria de ese tipo se llama ergódica. La hipótesis de su existencia 
es fundamental en los métodos estadísticos de la dinámica moderna 
y en la teoría atómica. Pero se conocen muy pocos ejemplos pertinen- 
tes en los que pueda darse una demostración matemática rigurosa de 


la hipótesis ergódica. 
Los ejemplos más sencillos se refieren al movimiento dentro de 
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una curva plana C, suponiendo que la frontera C se comporta como 
un espejo perfecto que refleje la partícula (la cual se movería en otro 
caso sin ninguna restricción) según el mismo ángulo bajo el cual 
chocó contra la curva; p. ej., una caja rectangular (una mesa de 
billar ideal de reflexión perfecta y un punto provisto de masa, como 
una bola) conduce en general a una trayectoria ergódica. La bola 
ideal, moviéndose indefinidamente, pasará por todo punto, salvo para 
algunas posiciones iniciales y direcciones singulares. Omitimos la 
demostración, aunque en principio no es difícil. 

De particular interés es el caso de una mesa elíptica, de focos Fi 
y Fə. Puesto que la tangente a una elipse forma ángulos iguales con 
los radios vectores del punto de tangencia, toda trayectoria que pase 
por un foco se reflejará en el otro, y así indefinidamente. No es difícil 
ver que, cualquiera que sea la dirección inicial, después de n refle- 
xiones, la trayectoria tiende, al aumentar n, al eje mayor F¡Fz. Si el 
rayo inicial no pasa por un foco, existen dos posibilidades: si pasa 
entre ambos focos, todos los rayos reflejados pasarán entre éstos y 
serán tangentes a una cierta hipérbola, de focos F} y Fa; si el rayo 
inicial no pasa entre Fi y F2, tampoco lo hará ninguno de los rayos 
reflejados y éstos serán tangentes a una elipse de focos Fi y Fa. Así, 
pues, el movimiento no será ergódico para la elipse en su totalidad. 


*Ejercicios: 

1. Demuéstrese que si el rayo inicial pasa por un foco de la elipse, la n-ésima 
reflexión del rayo inicial tenderá al eje mayor, al aumentar n. 

2. Demuéstrese que si el rayo inicial pasa entte los dos focos, todos los rayos 
reflejados harán otro tanto y serán tangentes a una hipérbola de focos Fy y Fa; 
análogamente, si el rayo inicial no pasa por entre los focos, tampoco lo hará nin- 
guno de los reflejados y todos éstos serán tangentes a una elipse, de focos Fi y 
F2. (Demuéstrese que el rayo, antes y después de reflejarse en R, forma ángulos 
iguales con las rectas RF, y RF, respectivamente, y pruébese a continuación 
que es posible de esta manera caracterizar las tangentes a un sistema de cónicas 
homofocales.) 


V. EL PROBLEMA DE STEINER 


1. El problema y su solución.—A principios del siglo x1x, Jacob 
Steiner, el famoso profesor de Geometría de la Universidad de Berlín, 
estudió un problema muy sencillo, pero sumamente instructivo. Tres 
aldeas, A, B, C, han de ser unidas por un sistema de carreteras de 
longitud total mínima, En términos matemáticos, el problema equi- 
vale a que se dan tres puntos A, B, C en el plano y se pide un cuarto 
punto P tal que la suma a + b + c sea un mínimo, representando esas 
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letras las distancias de P a A, B y C, respectivamente. La solución del 
problema es la siguiente: si en el triángulo ABC todos los ángulos 
son menores de 1200, P es el punto desde el cual cada uno de los tres 
lados AB, BC, CA subtiende un 
ángulo de 120%. Sin embargo, si 
un ángulo de ABC, p. ej., el C, 
es igual o mayor que 1200, el 
punto P coincide con el vér- 
tice C. 

Es fácil obtener esta solu- 
ción, utilizando los resultados 
anteriores relativos a valores 
extremos. Supongamos que P 
es el punto buscado. Existen las c 
siguientes posibilidades: o P Fre. 208: Sune hinia de distancias 
coincide con uno de los vértices 
A, B, C, o es distinto de ellos. En el primer caso, es evidente que P 
debe ser el vértice del mayor ángulo C de ABC, puesto que la suma 
CA + CB es menor que cualquier otra suma de otros dos lados del 
triángulo ABC. Así, para completar la demostración, debemos consi- 
derar el segundo caso. Sea K una cir- 
cunferencia de radio c y centro C. 
Entonces P debe ser un punto de K, 
tal que PA + PB sea minimo. Si A 
y B son exteriores a K (Fig. 209), de 
acuerdo con lo dicho en la página 342, 
PA y PB deben formar ángulos igua- 
les con la circunferencia K, o sea, con 
el radio PC, que es perpendicular a 
K. Puesto que el mismo razonamiento 

Fic. 209. se aplica a la posición de P y al 

círculo de radio a y centro A, resulta 

que los tres ángulos formados por PA, PB, PC son iguales, o sea, 

que cada uno vale 1200 como habíamos dicho. En el razonamiento 

se ha supuesto que A y B son exteriores a K, lo que queda aún por 

demostrar. Si al menos uno de los puntos A y B, p. ej., A, se encon- 

trara en K o fuera interior, puesto que P, como sé ha supuesto, no 

coincide con A o B, tendríamos a + b > AB. Pero AC <c, ya que 
A no es exterior a K. De donde resulta: 


B 








a+b+c>AB+ AC, 
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lo que significa que obtendríamos la mínima suma de distancias si P 
coincidiera con A, contra nuestra hipótesis. Esto demuestra que tanto 
A como B son exteriores al círculo K. El hecho correspondiente se 
demuestra en forma similar para las otras combinaciones: B, C res- 
pecto al círculo de radio a y centro A, y A, C, respecto al círculo de 
radio b y centro B. 

2. Análisis de los casos posibles.—Para verificar cuál de los dos 
casos posibles respecto a la posición de P sucede realmente debemos 
examinar la construcción de dicho punto P. Para determinar éste, 
trazamos las circunferencias K; y K2, sobre las cuales dos lados, p. ej., 
AC y BC, subtienden arcos de 120%, Entonces, AC subtenderá tam- 
bién un ángulo de 1200 desde cualquier punto del menor de los arcos 
en que AC divide a Kı; pero subtenderá 60% desde cualquier punto 


Z 


ÈR 


ALLL 


A B 
FIG. 210. 


del arco mayor. La intersección de los dos arcos menores, siempre 
que exista, proporciona el punto buscado P, pues no sólo AC y BC 
subtenderán un arco de 1200 en P, sino que lo mismo sucederá con 
AB, por ser 3600 la suma de los tres ángulos. 

De la figura 210 resulta evidente que si ninguno de los ángulos 
del triángulo ABC es mayor que 1200, los dos arcos más cortos se 
cortarán dentro del triángulo. Por otra parte, si un ángulo C del 
triángulo ABC es mayor que 1200, los dos arcos más cortos de Kı 
y Ka no se cortan, como se ve en la figura 211. En este caso, no existe 
un punto P desde el cual los tres lados subtiendan ángulos de 1200, 
Sin embargo, Kı y Ke determinan, por su intersección, un punto P’, 
desde el cual AC y BC subtienden ángulos de 602 cada uno, mientras el 
lado AB, opuesto al ángulo obtuso, subtiende un ángulo de 1200. 

Para un triángulo ABC que tenga un ángulo mayor de 120% no 
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existe, pues, ningún punto desde el cual los tres lados subtiendan 
ángulos de 120%. De ahí que el punto mínimo P deba coincidir con 
un vértice, puesto que, como ya se ha demostrado, es la única posi- 





FG. 211. 


bilidad restante, debiendo ser además el vértice del ángulo obtuso. 
Si, por otra parte, todos los ángulos del triángulo son menores de 1200, 
hemos visto que se puede determinar un punto desde el cual «cada 
lado subtienda un ángulo 
de 1200, Pero para com- 
pletar la demostración de- 
bemos probar todavía que 
a+ b+ c será realmente 
menor, en este caso, que 
si P coincidiera con cual- 
quiera de los vértices, ya 
que sólo hemos demostra- 
do que P proporciona un 
mínimo si la menor lon- 
gitud total no correspon- 
de a uno de los vértices. , B 
, Fic. 212. 

En consecuencia, debe- 

mos demostrar que a + b + c es menor que la suma de dos lados 
cualesquiera, p. ej., AB + AC. Para conseguirlo, prolonguemos 
BP y proyectemos A sobre esta recta, con lo que se obtiene un 


punto D (Fig. 212). Puesto que APD = 60°, la longitud de la pro- 
yección PD es 1fga, y como BD es la proyección de AB sobre BP, 
se tendrá que BD < AB. Ahora bien: BD = b + 1fga; o sea, 
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b +1/2a < AB. De igual forma, proyectando A sobre la prolonga- 
ción de PC, veríamos que c + 1l/2a < AC. Sumando, obtenemos la 
desigualdad a + b + c < AB + AC. Puesto que ya sabemos que el 
punto mínimo, si no es uno de los vértices, debe ser P, se deduce 
finalmente que éste es realmente el punto para el cual a + b + e es 
mínima. 

3. Un problema complementario.—Los métodos formales de la 
matemática nos llevan algunas veces más allá del objetivo original; 
p. ej., si el ángulo C es mayor de 1200, la construcción geométrica 
determina, no el punto solución P (que en este caso es el propio 
punto C), sino otro punto P* desde el cual aparece el lado mayor AB 
del triángulo ABC bajo un ángulo de 1209, y los dos más pequeños 
se ven bajo ángulos de 60% cada uno. Ciertamente, P’ no resuelve 
nuestro problema de mínimo, 
pero cabe sospechar que tiene 
alguna relación con él. La res- 
puesta es que P” resuelve el 
problema siguiente: hallar el 
mínimo de la expresión a+b—c. 

Fic. 213.4 +:b — e:= minimo. La demostración es por com- 

pleto análoga a la dada para 

a + b + c, basada en los resultados obtenidos en la página 347, por 

lo que se deja como ejercicio al lector. Si se combina con el resultado 
precedente, tenemos el teorema: 

Si los ángulos de un triángulo ABC son todos menores que 1200, 
la suma de las distancias a, b, c de un punto cualquiera a A, B, C, 
respectivamente, es mínima para aquel punto desde el cual se ve 
cada lado del triángulo bajo un ángulo de 1200, y a + b — c es mí- 
nima para el vértice C; si un ángulo, p. ej., C, es mayor que 1200, 
a+ b+c es mínima para C, y a + b — c lo es para un punto tal 
que los dos lados menores del triángulo subtiendan ángulos de 600, 
mientras que el mayor subtienda otro de 1200.. 

Así, pues, de los dos problemas de mínimo, uno puede resolverse 
siempre por la construcción conocida, y la solución del otro es un 





vértice. Para C = 1200, las dos soluciones de cada problema, e in- 
cluso las soluciones de ambos, coinciden, puesto que el punto que se 
obtiene por construcción es precisamente el vértice C. 

4. Observaciones y ejercicios.—Si desde un punto P, situado en el 
interior de un triángulo equilátero UVW, se trazan tres rectas per- 
pendiculares PA, PB, PC, según muestra la figura 214, los puntos 
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A, B, C y P forman la figura estudiada anteriormente. Esta obser- 
vación puede servir para resolver el problema de Steiner, comenzando 
por los puntos A, B, C y 
determinando a continuación 


W 

U, V, W. 

Ejercicios: 

1. Efectúese esta construc- 
ción, utilizando la propiedad de 
que para todo punto de un trián- 
gulo equilátero, la suma de los 
tres segmentos normales a sus LE 

B 


lados es constante e igual a la 
altura. 
2. Haciendo uso de la pro- 
piedad correspondiente cuando P 
es exterior al triángulo, discútase 
el problema complementario. En 
tres dimensiones puede estudiarse U € Y 
el problema análogo siguiente: 
dados cuatro puntos A, B, C, D, Fic. 214.— Otra demostración de la solución 
hállese un quinto punto P tal que de Steiner. 
a + b -+c -+ d sea mínima, 
*Ejercicio: Estúdiese este problema y su complementario mediante los méto- 
dos dados en las páginas 341 y siguientes, o utilizando un tetraedro regular. 





5. Generalización al problema de la red de carreteras.—En el pro- 
blema de Steiner, se dan tres puntos A, B, C. Es natural generali- 
zarlo al caso de ser n los puntos dados 


A, 5 y en el plano, A1, Az, Az, ..., An, y pi- 
diéndose entonces el punto P, para 

A äi el cual la suma de las distancias 

a a .. + 4p sea mínima 

Fic. 215. —Suma mínima de distan- 1 + 2 + a3 + + a j 
cias a cuatro puntos. siendo q; la distancia PA;. (Para cua- 


tro puntos, dispuestos como en la figu- 
ra 215, el punto P es el de intersección de las diagonales del cuadri- 
látero A1A24344, lo que el lector puede demostrar como ejercicio.) 
Este problema, del que también se ocupó Steiner, nos conduce a 
resultados interesantes. Es una de tantas generalizaciones superficia- 
les que aparecen con frecuencia en la literatura matemática. Para 
encontrar la generalización verdaderamente significativa del proble- 
ma de Steiner debemos abandonar la búsqueda de un punto único P, 
y en su lugar trataremos de hallar la «red de carreteras» de longitud 
total mínima, lo que en lenguaje matemático se expresa asi: Dados n 
puntos Ay, ..., An determínese un sistema conexo de segmentos rectilíneos 
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de longitud total mínima, de tal modo que dos puntos cualesquiera que- 
den unidos por una poligonal formada por segmentos del sistema. 
La solución depende, por supuesto, de la ordenación de los puntos 


. ÁS 
A, 
| As 4 A. 
A: 
A, 
As A 
As 


Ar 


A 
A, 


Frias. 216-18. — Redes mínimas uniendo más de tres puntos. 


dados. El lector podrá estudiar fructiferamente el tema, basándose 
en la solución del problema de Steiner. Aquí nos limitaremos a esbo- 
zar la respuesta en los casos típicos representados en las figuras 216 
a 218. En el primero, la solución consta de cinco segmentos con dos 


PAL 


Fics. 219-20.— Dos redes mínimas uniendo cuatro puntos. 


intersecciones múltiples, donde tres de los segmentos se cortan for- 
mando ángulos de 120%. En el segundo caso, la solución contiene tres 
intersecciones múltiples. Si los puntos se disponen de otra manera, 
dichas figuras pueden ser imposibles. Una o varias de las intersec- 


SEC. VI] VALORES. EXTREMOS Y DESIGUALDADES 371 











ciones múltiples pueden degenerar, apareciendo en su lugar uno o 
más de los puntos dados, como en el tercer caso. 

En el caso de ser n los puntos dados, existirán por lo menos n—2 
intersecciones múltiples, en cada una de las cuales tres segmentos 
formarán ángulos de 1200, 

La solución del problema no está siempre unívocamente determina- 
da. Para cuatro puntos A, B, C, D, que formen un cuadrado, tenemos 
dos soluciones equivalentes que aparecen en las figuras 219 y 220. Si los 
puntos A, Az, ..., An son los vértices de una poligonal simple con án- 
gulos suficientemente obtusos, esta misma será la de longitud mínima. 


VI. VALORES EXTREMOS Y DESIGUALDADES 


Uno de los rasgos característicos de la matemática superior es el 
importante papel que las desigualdades desempeñan en ella. En prin- 
cipio, la solución de un problema de máximo conduce siempre a una 
desigualdad, la cual expresa el hecho de que la variable que se con- 
sidera es menor o a lo sumo igual al valor máximo-que proporciona 
la solución. En muchos casos, tales desigualdades tienen -un interés 
independiente por sí mismas. Como ejemplo, consideraremos la im- 
portante desigualdad entre las medias aritmética y geométrica. 

1. Medias aritmética y geométrica de dos: cantidades positivas. 
Comencemos por un sencillo problema de máximo que aparece a 
menudo en la matemática pura y en la aplicada. En lenguaje geomé- 
trico equivale a lo siguiente: entre todos los rectángulos de períme- 
tro dado, hállese el de mayor área. Como era de esperar, la solución 
es un cuadrado. Para demostrarlo se razona de la manera siguiente: 
sea 2a el perímetro dado del rectángulo. La suma de dos lados adya- 
centes, x + y, queda fijada al dar el perímetro, mientras que el área 
variable xy deberá hacerse tan grande como sea posible. La «media 
aritmética» de x e y es sencillamente 








z+Y 
== 
Introduzcamos ahora la cantidad 
z— 
d= — A 
de donde se deduce: 
r=m+d, =m-— d, 


y, en consecuencia, 


g. 


2 
zy = (m + d) (m — d) = mè — dè = CEY 5 
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Puesto que d? es mayor que cero, excepto para d = 0, se obtiene 
inmediatamente la desigualdad 


z+ 
V zy < E, 11] 





donde el signo de igualdad sólo es válido cuando d=0 y 1=y=m. 
Puesto que x + y es fija, se deduce que V tJ, y, en consecuencia, 
el área xy será máxima, cuando x = y. La expresión 


s= Vz, 


en la que deberá tomarse la raíz con signo positivo, se llama «media 
geométrica» de las cantidades positivas x e y. La desigualdad [1] ex- 
presa la relación fundamental entre las medias aritmética y geométrica. 

Se obtiene también directamente la desigualdad [1] del hecho de 
ser necesariamente no negativa la expresión 


(Vz — Vye =z +y — 2V zy, 
pues es un cuadrado que sólo puede ser igual a cero para x = y. 


y 


1+y=2m 
Fic. 221. — Máximo de xy, dada x -} y. 
Puede deducirse una consecuencia geométrica de dicha desigual- 


dad, considerando en el plano la recta fija x + y = 2m, junto con 
la familia de curvas xy = c, donde c es constante para cada una de 
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las curvas (hipérbolas), y varía de una a otra. Como resulta evidente 
de la figura 221, la curva para la que es máximo el valor de c y tiene 
un punto común con la recta dada es la hipérbola tangente a la recta 
en el punto x = y = m; para ella, evidentemente, c = m2. En con- 


secuencia, 
2 
æ+ 
He (=) 


Debe hacerse constar que cualquier desigualdad del tipo f(x, y) < 
< g(x, y) puede leerse en ambas direcciones, por lo que proporciona 
no sólo una propiedad de máximo, sino también otra de mínimo; 
p. ej., [1] expresa también la propiedad de que entre todos los rec- 
tángulos de área dada, el cuadrado es el de perímetro mínimo. 

2. Generalización para «n» variables.—Puede generalizarse la des- 
igualdad [1] entre las medias aritmética y geométrica para cualquier 
número n de cantidades positivas, que denotaremos por £1, £2, T3, ..., Tn- 
Decimos que 


MEC 
3 n 


es la media aritmética, y 
a z 
g = Vat *"* Za 


la media geométrica, entendiendo en este último caso que se trata de 
la raíz positiva. El teorema general dice que 


g<m, [2] 


siendo g = m sólo si todos los x, son iguales. 

Se han dado muchas y muy ingeniosas demostraciones de este 
resultado general. La más sencilla consiste en reducirla al mismo ra- 
zonamiento utilizado en la página 371, planteando el siguiente pro- 
blema de máximo: dividir una cantidad positiva C en n partes posi- 
tivas, C=1 +22 + ... + Yn, de tal modo que el producto P = 
= T13 ... Zn sea máximo. Comencemos por suponer—hipótesis en 
apariencia obvia, pero que se analizará más adelante—que existe un 
máximo de P y que éste tiene lugar para el siguiente conjunto de 
valores: 

tı = 01, *** , En = Gp. 


Todo se reduce a probar que a; = a2 = ... = än, pues en tal caso 
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se tiene: g = m. Supongamos que eso no fuera cierto; p. ej., que 
a Æ az. Consideremos las n cantidades 


Ti = S$, T2 = S$, T3 = 03, **' , In = An, 
siendo 


aı + a2 
2 


En otras palabras, reemplacemos las cantidades a; por otro con- 
junto, en el cual han cambiado sólo las dos primeras, que se han 
hecho iguales, mientras que la suma total C permanece invariable, 
Podemos escribir 


a=s-+d, da =S — d, 
donde 
di — Q 
d= > 
El nuevo producto es 
P’ = s2» a43*** Un, 
mientras que el primitivo era 
P = (s + d) + (s — d) + d3*** an = (85? — d?) - as +t an, 
por lo que, evidentemente, a menos que sea d = 0, se tendrá 
P<P, 


contra la hipótesis según la cual P era máximo. En consecuencia, 
d = 0 y a, = 42. De la misma manera podemos demostrar que a41=a;, 
donde a; representa cualquiera de las cantidades a. Finalmente, se 
deduce que todas las a; deberán ser iguales. Puesto que g = m cuando 
todas las x, son iguales, y como hemos demostrado que sólo en este 
caso se obtiene el máximo de g, resulta que, en cualquier otro, será 
g <m, como queríamos demostrar. 

3. El método de los cuadrados mínimos.—La media aritmética de 
n números Ti, T2, ..., Zn, que en lo que sigue no precisan ser necesa- 
riamente positivos, tiene una importante propiedad de mínimo. Sea 
u una cantidad desconocida, que queremos determinar con tanta pre- 
cisión como sea posible, mediante un instrumento de medida. Con 
este fin, efectuamos cierto número n de lecturas, que pueden dar 
lugar a resultados ligeramente distintos, 21, ..., Zn, debido a diversas 
causas de error experimental. Surge entonces la cuestión de saber 
qué valor de u deberá aceptarse como más plausible; es costumbre 
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elegir como valor «plausible» u «óptimo» la media aritmética m = 
= HTA Para justificar debidamente esta hipótesis, sería 
necesario entrar en una detallada discusión de la teoría de las proba- 
bilidades. Pero, al menos, podemos señalar una propiedad de mínimo 
de m que hace razonable nuestra elección. Sea u un valor cualquiera 
posible de la cantidad medida. Las diferencias u — £i, ..., U — £n, Me- 
dirán las desviaciones existentes entre las diferentes lecturas z; y este 
valor. Algunas de esas desviaciones serán positivas, mientras otras 
serán negativas, y parece natural suponer que el valor óptimo de u es 
tal que la desviación total, en cierto sentido, resulte lo más pe- 
queña posible, Siguiendo a Gauss, se acostumbra tomar, no las desvia- 
ciones, sino sus cuadrados (u — x;)?, como una medida apropiada del 
error, y elegir como valor óptimo entre todas los posibles valores de u 
el que hace mínima la suma de los cuadrados de las desviaciones: 


(u — z)? + (u — z)? + >> + (U — 2n). 


Este valor óptimo de u es precisamente la media aritmética m, hecho 
que constituye el punto de partida del importante «método de los 
cuadrados mínimos» de Gauss. Podemos demostrar de una manera 
muy elegante la afirmación en cursiva. Si escribimos 


(u — x1) = (m — 21) + (u — m), 
se obtiene: 


(u — xy? = (m — x;} + (u — m3 + 2(m — 1;) (u — m). 


Sumemos ahora todas estas ecuaciones para i = 1, 2, ..., n. Los últi- 
mos términos dan 2(u — m) (nm — xı — ... — Xn), que es cero, como 
se deduce de la definición de m. En consecuencia, queda 


(u — 2)2 + > + (U — Xp)! = (m — 12 + >> + (m — xp! + n(m — uy, 
lo que demuestra que 
(u — 121) ++ + (u — zn)? > (m — 11}? + >> + (mM — zn), 


y que el signo de igualdad sólo se verifica para u = m, según que- 
ríamos probar. 

El método general de los cuadrados mínimos parte de este resul- 
tado, utilizándolo como norma orientadora en los casos más compli- 
cados, cnando se trata de decidir cuál es el valor más plausible que 
puede deducirse de medidas entre las cuales existen ligeras contradic- 
ciones. Supongamos, p. ej., que hemos medido las coordenadas de n 
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puntos, £i, Yi, de una línea que teóricamente debía ser recta, y supon- 
gamos además que los puntos medidos no se encuentran exactamente 
sobre una recta. ¿Cómo deberemos trazar la recta que mejor se ajuste 
a los n puntos observados? Los resultados anteriores sugieren el pro- 
cedimiento siguiente, que, ciertamente, podría reemplazarse por otras > 
variantes igualmente razonables: sea y = ax + b la ecuación de la 
recta, por lo que el problema consiste en determinar los coeficientes 
a y b. La distancia en la dirección de las y, desde la recta al punto 
Xi, Yi, está dada por y; — (ax; + b) = yi — axı — b, siendo el signo 
positivo o negativo, según que el punto se encuentre por encima o 
por debajo de la recta. El cuadrado de esa distancia será, pues, 
(y, — ax, — b)? y el método consiste sencillamente en determinar a y b 
de tal manera que la expresión 


(Yı — axı — b) + ++- + (Yn — Alp — by 


tenga el menor valor posible. Así, pues, en este caso tenemos un pro- 
blema de mínimo que incluye dos cantidades desconocidas: a y b. 
Aunque muy sencilla, omitimos la discusión detallada de la solución. 


VII. EXISTENCIA DE EXTREMOS. PRINCIPIO DE DIRICHLET 


1. Observaciones generales.—En algunos de los problemas ante- 
riores de máximos y mínimos se prueba directamente que la solución 
proporciona el mejor resultado posible. Un ejemplo notable es la so- 
lución de Schwarz del problema del triángulo, en cuyo caso pudimos 
ver sin dificultad que ningún triángulo inscrito tiene un perímetro 
menor que el triángulo órtico. Otros ejemplos son los problemas de 
máximos y mínimos, cuyas soluciones dependen de una desigualdad 
explicita, tal como la existente entre las medias geométrica y arit- 
mética. Pero en algunos de los problemas tratados hemos seguido un 
camino distinto. Se comienza por suponer que se ha encontrado una 
solución; analizando esta hipótesis extraemos conclusiones que pue- 
den eventualmente caracterizar y construir la solución. Así ocurrió, 
por ejemplo, con la solución del problema de Steiner y con el segundo 
método de resolución del problema de Schwarz. Ambos métodos son 
lógicamente diferentes. En cierto sentido, el primero es más perfecto, 
puesto que proporciona una demostración, más o menos constructiva, 
de la solución. Como tuvimos ocasión de ver en el caso del problema 
del triángulo, es probable que el segundo método sea más sencillo; 
pero no es tan directo y, sobre todo, tiene un vicio de origen en su 
estructura, pues empieza suponiendo que existe una solución del pro- 
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blema. Proporciona tal solución sólo si se admite o se demuestra que 
ésta existe. Sin esa hipótesis previa, se limita a probar que si existe 
una solución, debe poseer cierto carácter 1. 

Debido a la aparente evidencia de la premisa de que existe una 
solución, los matemáticos, hasta finales del siglo xıx, no prestaron 
atención a la cuestión lógica inmanente, aceptando como cosa natural 
la existencia de solución en los problemas de máximos y mínimos. 
Algunos de los más grandes matemáticos del siglo xıx—Gauss, Dirich- 
let y Riemann—utilizaron sin discriminación tal hipótesis, tomándola 
como base para la investigación de difíciles teoremas de física mate- 
mática y teoría de funciones, que de otro modo hubieran resultado 
casi inasequibles. El punto culminante se produjo en 1849, cuando 
Riemann publicó su tesis doctoral sobre los fundamentos de la teoría 
de funciones de variable compleja. Aquella memoria, tan concisa- 
mente escrita y uno de los trabajos más importantes de la matemática 
moderna, era tan heterodoxa en su forma de atacar el problema, que 
mucha gente hubiera preferido ignorarla. Weierstrass era entonces el 
matemático más notable de la Universidad de Berlín, y el maestro 
reconocido por todos de la construcción de una teoría de funciones 
rigurosa. Impresionado por su lectura, pero un tanto escéptico, pronto 
descubrió una laguna lógica en aquella memoria, que el autor no se 
había preocupado de llenar. La rigurosa crítica de Weierstrass, si 
bien no influyó en el ánimo de Riemann, hizo que se ignorara casi por 
completo su teoría. La carrera meteórica de Riemann terminó súbita- 
mente, pues murió tuberculoso pocos años después. Pero sus ideas 
encontraron siempre algunos entusiastas discípulos, y cincuenta años 
después de la publicación de su tesis, Hilbert consiguió abrir el ca- 
mino para dar una respuesta completa a todas las cuestiones que 
había dejado sin esclarecer. Todo este desarrollo de la matemática y 
de la física matemática se convirtió en uno de los más grandes triun- 
fos en la historia del análisis matemático moderno. 

En la memoria de Riemann, el punto expuesto al ataque de la crí- 
tica es la cuestión de la existencia de mínimo. Riemann basó gran 
parte de su teoría en lo que él llamaba principio de Dirichlet, (Dirichlet 
había sido profesor de Riemann en Gotinga, y había expuesto esta 
cuestión en sus clases, pero nunca publicó nada sobre dicho principio.) 
Supongamos, p. ej., que una parte de un plano o de cualquier super- 
ficie se recubre con una lámina de estaño muy fina, y que se esta- 
blece una corriente eléctrica estacionaria en la lámina metálica, co- 
Y La necesidad lógica de probar la existencia de un extremo se aclara con el siguiente 


sofisma: 1 es el mayor de los enteros. Representemos e zx el máximo entero; si fuera r>1, 
entonces 22 > x, y, por tanto, no sería x el máximo, consecuencia, x debe ser igual a 1. 
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nectándola en dos puntos con los dos polos de'“una pila eléctrica. No 
cabe duda de que esta experiencia física conduce a un resultado defi- 
nido. Pero ¿qué ocurre con el problema matemático correspondiente, 
que es de la máxima importancia en teoría de funciones y en otros 
campos? De acuerdo con la teoría de la electricidad, el fenómeno 
físico se describe como un «problema de valores de contorno de una 
ecuación en derivadas parciales». Es el problema matemático el 
que nos interesa; su resolubilidad parece posible, puesto que equivale 
a un fenómeno físico; pero esta argumentación no prueba nada ma- 
temáticamente. Riemann trató la cuestión matemática en dos eta- 
pas. Primero, demostró que el problema equivale a un problema de 
mínimo: cierta cantidad que expresa la energía del flujo eléctrico 
es mínima en el caso del flujo real en comparación con los otros flu- 
jos posibles, dentro de las condiciones prescritas. Enunció, después, 
como principio de Dirichlet, que tal problema de mínimo tiene solu- 
ción. Riemann no dió el menor paso en busca de una demostración 
matemática de la segunda afirmación, y éste fué el punto objeto de 
los ataques de Weierstrass. No sólo no era evidente la existencia de 
un mínimo, sino que además resultó ser una cuestión sumamente deli- 
cada, para cuyo estudio no estaba preparada la matemática de aquella 
época, y que, finalmente, sólo se resolvió después de muchas décadas 
de investigación intensa. 

2. Ejemplos.—Explicaremos la índole de la dificultad a que se 
hace mención, mediante dos ejemplos: 1) Sobre una recta L tomemos 
dos puntos A y B a una distancia d y busquemos la poligonal de 


10 


O' 


A B E 


Fic. 222. 


longitud mínima que partiendo de A en dirección perpendicular a L, 
termina en B. Puesto que el segmento rectilíneo AB es la distancia 
más corta de A a B entre todos los caminos posibles, podemos estar 
seguros que cualquier otro camino admisible tiene una longitud mayor 
que d, pues el único que tiene esa misma longitud d es el segmento 
rectilíneo AB, el cual no cumple la restricción impuesta en cuanto 
a la dirección en A, y, por consiguiente, no es admisible dentro de las 
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condiciones del problema. Por otra parte, si se considera el camino 
admisible AOB (Fig. 222) se encuentra que, al reemplazar O por otro 
punto O” suficientemente próximo al A, podemos obtener un eamino 
admisible, cuya longitud diferirá tan poco como se quiera de d; en 
consecuencia, si existe un camino admisible de longitud mínima, ésta 
no puede ser mayor que d, por lo que debe ser exactamente igual a d. 
Pero el único camino que tiene tal longitud no es admisible; por tanto, 
no puede existir un camino de longitud mínima cumpliendo dicha 
condición, y el problema propuesto no tiene solución. 

2) Sea C una circunferencia (Fig. 223) y S un punto a distancia l 
por encima de su centro; consideremos el conjunto de todas las su- 
perficies limitadas por C, que pasan por el punto S y que se encuen- 
tran por encima de C, de tal forma que dos pun- S 
tos distintos no tengan la misma proyección ver- 
tical sobre el plano de C. ¿Cuál es, entre todas 
estás superficies, la de área mínima? Por muy 
natural que parezca este problema, carece de 
solución: no existe una superficie que cumpla los 
requisitos del problema y tenga área mínima. Si 
no se-exige que la superficie pase por S, la solu- 
ción. será evidentemente el disco circular plano 
limitado por C, y cuya área llamaremos A. Cual- 
quier otra superficie limitada por C, debe tener FIG. 223, 
área mayor que A. Pero podemos encontrar una 
superficie que cumpla las condiciones del problema y cuya área exceda 
de A tan poco como queramos. Para esto consideremos una superficie 
cónica de altura 1 y de radio tan pequeño en la base que su área sea 
menor que cualquier valor asignado. Coloquemos este cono sobre el 
disco de tal modo que su vértice coincida con S y consideremos la 
superficie total formada por la lateral del cono y la parte del disco que 
no está cubierta por él. Es evidente que esta superficie, la cual sólo 
se desvía del disco en las proximidades de su centro, tiene un área 
que excede de A en menos del valor asignado, y como éste puede ele- 
girse arbitrariamente pequeño, resulta que el mínimo, si existe, no 
puede ser sino el área A del disco. Pero, entre todas las superficies 
limitadas por C, sólo el disco tiene esta área, y como no pasa por S, 
no cumple una de las condiciones del problema. En consecuencia, éste 
carece de solución. 

Podemos prescindir de otros ejemplos más complicados que dió 
Weierstrass; los dos considerados bastan para probár que la exis- 
tencia de un mínimo no es una parte trivial de una demostración 
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matemática. Expongamos la. cuestión de una manera más general y 
abstracta. Consideremos una clase definida de entes, p. ej., curvas o 
superficies, a cada una de las cuales se le asigna como función una 
longitud o un área. Si la clase se compone sólo de un número finito 
de objetos, entre los números correspondientes debe existir evidente- 
mente un máximo y un mínimo. Pero si la clase se compone de infi- 
nitos objetos, no existe necesariamente ni lo uno ni lo otro, ni siquiera 
en el caso en que estos números estén comprendidos entre límites 
fijos. En general, dichos números formarán un conjunto infinito de 
puntos sobre la recta numérica. Supongamos, para mayor sencillez, 
que todos son positivos. Entonces, el conjunto tendrá un «extremo 
inferior»; es decir, un punto a a cuya izquierda no se encuentra nin- 
gún elemento del conjunto y que es o un elemento del mismo o tal 
que los elementos del conjunto se aproximan a él tanto como se desee. 
Si a pertenece al conjunto es su elemento mínimo; en otro caso, el 
conjunto carece de mínimo. Así, p. ej., el conjunto de los núme- 
ros 1, 1/2, 1/3, ..., no contiene elemento mínimo, pues el extremo 
inferior, 0, no pertenece al conjunto. Estos ejemplos aclaran de 
una manera abstracta las dificultades lógicas relacionadas con el pro- 
blema de existencia. La solución matemática de un problema de mí- 
nimo no queda completa hasta haber demostrado, explícita o implíci- 
tamente, que el conjunto de valores asociado al problema contiene 
un elemento menor que todos los restantes. 

3. Problemas elementales de extremos.—En los problemas ele- 
mentales, sólo se requiere un análisis atento de los conceptos funda- 
mentales en que se basan para decidir la cuestión de la existencia de 
una solución. En el capítulo VI se discutió el concepto general de 
conjunto compacto, y vimos allí que una función continua, definida 
para los elementos de un conjunto compacto, siempre alcanza un 
máximo y un minimo en algún punto del conjunto. En cada uno de 
los problemas elementales que hemos estudiado, los valores que se 
discuten pueden considerarse como los de una función de una o varias 
variables definida en un dominio, que es un conjunto compacto o 
puede reducirse a él sin modificación esencial del problema. En tal 
caso, está asegurada la existencia de máximo o de mínimo; en el 
problema de Steiner, p. ej., la cantidad considerada era la suma de 
tres distancias, que depende de forma continua de la posición del 
punto móvil. Puesto que el dominio de este punto abarca todo el 
plano, nada se pierde si encerramos la figura en un círculo de gran 
radio y nos restringimos a que el punto varíe en su interior y sobre 
la circunferencia. Pues tan pronto como el punto móvil se encuentra 
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suficientemente alejado de los tres puntos dados, la suma de sus 
distancias a éstos será mayor que AB + BC, que es uno de los valo- 
res posibles de la función. En consecuencia, si existe un mínimo para 
un punto dentro del círculo, éste será también el mínimo para el 
problema sin aquella restricción. Pero es fácil probar que el domi- 
nio compuesto por una circunferencia y su interior es compacto; por 
tanto, existe un mínimo para el problema de Steiner. 

La importancia de suponer que el dominio de variación de la va- 
riable independiente es compacto se pone de manifiesto mediante el 
siguiente ejemplo: dadas dos curvas cerradas, Cı y Cz, existen siempre 
dos puntos, P, y Pz, situados, respectivamente, sobre Cı y C2 tales 
que su distancia es mínima; así como otros dos puntos, Q1 y Qz, cuya 


O N 
al 


Fic, 224. —Curvas entre las que no hay distancia máxima ni mínima. 


distancia es máxima, pues la distancia entre un punto A, de Cı y 
otro Az de Cz es una función continua en el conjunto compacto for- 
mado por las parejas de puntos A; y Az que se consideran. Sin em- 
bargo, si las dos curvas no están limitadas, sino que se extienden 
hasta el infinito, el problema puede carecer de solución. En el caso 
expuesto en la figura 224, no existe ni mínimo ni máximo de ladis- 
tancia entre las dos curvas; el extremo inferior de aquélla es 0, y el 
superior, infinito, no alcanzándose ninguno de los dos. En algunos 
casos, existe mínimo pero no máximo. Para el caso.de las dos ramas 
de la hipérbola (Fig. 17) sólo se alcanza la distancia mínima, en A 
y A”, puesto que evidentemente no existen dos puntos separados. por 
una distancia máxima. 

Podemos explicar este diferente comportamiento, restringiendo ar- 
tificialmente el dominio de las variables. Elijamos un núméro positivo 
arbitrario R y restrinjamos la z por la condición |x| < R. Entonces 
existe tanto un máximo como un mínimo para los dos últimos pro- 
blemas. En el primero la limitación del contorno en esta forma ase- 
gura la existencia de una distancia máxima y otra mínima, que se 
alcanzan ambas en la frontera. Si R aumenta, los puntos en que se 
alcanzan los extremos se encuentran también sobre el contorno. En 
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consecuencia, al aumentar R, esos puntos se alejan infinitamente. En 
el segundo caso, la distancia mínima se alcanza en el interior, y por 
mucho que se aumente R, los dos puntos cuya distancia es mínima 
siguen siendo los mismos. 

4. Dificultades en casos más complicados.—Mientras que la cues- 
tión de existencia no es muy grave en los problemas elementales de 
una, dos o a lo sumo un número finito de variables independientes, 
cambia el aspecto por completo cuando se trata del principio de 
Dirichlet e incluso en casos más simples de tipo análogo. La razón de 
ello es que o bien el dominio de la variable independiente no es com- 


ON 


PUNA ASA 


FG. 225. — Aproximación a la longitud del segmento por polígonos 
de longitud doble. 

pacto, o la propia función no es continua. En el ejemplo tratado en 
la página 378,-teníamos una sucesión de caminos AO'B tal que O' 
tendía al punto A. Cada camino de la sucesión satisface las condicio- 
nes impuestas, pero los caminos AO'B tienden al segmento rectilíneo 
AB, el cual no pertenece al conjunto de las trayectorias permitidas. 
El conjunto de los caminos admisibles es, en este aspecto, análogo al 
intervalo 0 < x < 1, para el cual no es válido el teorema de Weier- 
strass sobre valores extremos (pág. 324). En el segundo ejemplo nos 
encontramos en una situación análoga: si disminuye cada vez más el 
radio de la base de los conos, la sucesión de las correspondientes super- 
ficies admisibles tenderá al disco circular, más un segmento rectilineo 
vertical que alcanza hasta S. Este ente geométrico, sin embargo, no 
figura entre las superficies admisibles, y ocurre nuevamente que el 
conjunto de dichas superficies no es compacto. 

Como ejemplo de una dependencia no continua tenemos la longi- 
tud de una curva. Dicha longitud no es una función de un número 
finito de variables, puesto que una curva no puede caracterizarse por 
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un número finito de «coordenadas», y no es una función continua de 
la curva. Para comprender bien esto, unamos dos puntos A y B, si- 
tuados a una distancia d, mediante una poligonal Py, que junto con 
el segmento AB forma n triángulos equiláteros. Se deduce claramente 
de la figura 225 que la longitud total de Pn será exactamente 2d, 
cualquiera que sea el valor de n. Consideremos ahora la sucesión de 
poligonales Py, P2, ... La altura de cada una de las ondas disminuye 
a medida que crece su número, y es evidente que la poligonal. Pn 
tiende al segmento AB. La longitud de P, es siempre 2d, cualquiera 
que sea el subíndice n, mientras que la longitud de- la curva: límite, 
el segmento rectilíneo, sólo es d. De ahí que la longitud no dependa 
de la curva de: manera continua. 

Todos estos ejemplos confirman que las precauciones respecto de 
la existencia de solución son realmente necesarias en los problemas 
de mínimo de una estructura más compleja. 


VIN. EL PROBLEMA DE LOS ISOPERÍMETROS 


Uno de los hechos evidentes de la matemática, para el cual sólo 
los métodos modernos han dado una demostración rigurosa, es el re- 
ferente a que, de todas las curvas cerradas de igual longitud, la cir- 
cunferencia es la que encierra un área Y 
mayor. Steiner encontró diversas demos- TN 
traciones ingeniosas de este teorema, de A 
las cuales sólo consideraremos una. Nt/ 

Comencemos por suponer que existe 
solución. Concedido esto, supongamos 
que la curva C es la requerida; o sea, 
tiene lá longitud prescrita y encierra el 
área máxima, Es fácil ver que C debe R 
ser convexa; es decir, todo segmento Fie. 226. 
rectilíneo que una dos puntos cuales- 
quiera de ella, debe estar situado enteramente dentro de C o sobre C. 
En efecto, si C no fuera convexa, como en la figura 226, sería posible 
trazar un segmento, tal como OP, entre dos puntos O y P de €, si- 
tuado fuera de C; el arco 00'P, simétrico de OQP respecto a la recta 
OP, forma junto con el arco ORP una curva de longitud L, que 
encierra una superficie mayor que C, puesto que incluye además las 
áreas adicionales 7 y II. Esto contradice la hipótesis según la cual C 
contiene el área máxima entre todas las curvas cerradas de longi- 
tud L. Por tanto, C debe ser convexa. 
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Elijamos ahora dos puntos, A, B, que dividan la curva solución C 
en dós arcos de igual longitud. Entonces, la recta AB debe dividir el 
área de C en dos partes iguales, pues en otro caso, hallando la simé- 
trica respecto a AB de la mayor de las dos (Fig. 227) se obtendría 
otra curva de longitud L, que encerraría un área mayor que la de C. 
Se deduce de ahí que la mitad de 
la solución C debe resolver el si- 
guiente problema: encontrar un 
arco de longitud L/2, cuyos extre- 
mos A y B estén sobre una recta 
dada y tal que se encierre un área 
máxima entre dicho arco y la recta. 
Probaremos ahora que la solución 
de este nuevo problema es una 
semicircunferencia, por lo que la 

FIG. 227, curva C que resuelve el primer 

problema es una circunferencia. 

Sea el arco AOB la solución del nuevo problema. Basta demostrar que 
todo ángulo inscrito AOB (Fig. 228) es recto, con lo que quedará 
establecido que AOB es una semicircunferencia. Supongamos, por el 
contrario, que el ángulo AOB no fuera recto. Entonces, sustituímos 
la figura 228 por la 229, en la cual las áreas rayadas y la longitud del 
arco AOB no han variado, pero el área triangular ha aumentado al 
tomar el ángulo AOB igual o muy próximo a 900, Así, la figura 229 


0 
(0) 


FiG. 228. Fic, 229, 


proporciona un área mayor que la original (véase pág. 341). Pero 
habíamos hecho la hipótesis de que la figura 228 resolvía el pro- 
blema, de forma que la segunda figura no puede dar un área mayor. 
Esta contradicción prueba que para todo punto O el ángulo AOB 
debe ser recto, con lo que se completa la demostración. 

Esta propiedad isoperimétrica del círculo puede expresarse me- 
diante una desigualdad. Si L es la circunferencia del círculo, su área 
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será L*/4m, por lo que debe existir la desigualdad isoperimétrica 
A < L?/4r entre el área A y la longitud L de cualquier curva cerrada, 
verificándose el signo de igualdad sólo para el circulo, 

*Como se deduce de la discusión hecha en las páginas 376-82, la 
demostración de Steiner tiene sólo un valor condicional: «Si existe 
una curva de longitud L, de área máxima, ha de ser una circunfe- 
rencia.» Para demostrar esta premisa hipotética se necesita una nueva 
argumentación. Probemos primero un teorema elemental, que se re- 
fiere a los polígonos cerrados Py, con un número par de lados, 2n, el 
cual dice que entre todos los polígonos de 2n lados y del mismo períme- 
tro, el 2n-ágono regular encierra la superficie máxima. La demostración 
coincide en lo fundamental con el razonamiento de Steiner, si bien 
contiene algunas modificaciones. Aquí no se 
plantea ninguna dificultad respecto al proble- 
ma de existencia, puesto que el polígono de 2n 
lados, así como su perímetro y su área, depen- 
den de manera continua de las 4n coordenadas 
de sus vértices, que sin pérdida de generalidad 
pueden quedar restringidas a un conjunto com- 
pacto de puntos en un espacio de 4n dimen- 
siones. De acuerdo con ello, en este problema 
de polígonos podemos empezar suponiendo que 
cierto polígono P es la solución y, partiendo 
de esta base, analizar las propiedades de P. Exactamente como en la 
demostración de Steiner, se deduce que P debe ser convexo. Demos- 
traremos ahora que los 2n lados de P tienen la misma longitud. Su- 
pongamos que dos lados adyacentes, AB y BC, tuvieran longitud 
diferente. Entonces podriamos separar el triángulo ABC de P y 
reemplazarlo por otro triángulo isósceles AB'C, en el cual AB'+B'C= 
= AB + BC y que tiene mayor área (véase pág. 344). Así obtendria- 
mos un polígono P’ con el mismo perímetro y área mayor, lo que 
contradice la hipótesis según la cual P era el polígono de área máxima 
de 2n lados. En consecuencia, todos los lados de P son de igual lon-* 
gitud, quedando por demostrar que es regular, para lo que basta pro- 
bar que todos los vértices de. P están sobre una circunferencia. El 
razonamiento sigue también paralelo al de Steiner. Previamente, de- 
mostraremos que toda diagonal que une dos vértices opuestos (p. ej., el 
primero con el n+1) divide la superficie en dos pártes iguales, y a con- 
tinuación probaremos que todos los vértices de cada una de esas partes 
están sobre una semicircunferencia. Los detalles, que siguen exacta- 
mente la marcha anterior, quedan como ejercicio a. cargo del lector. 





Fic, 230. 
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Puede probarse ahora la existencia, así como la solución del pro- 
blema, mediante un proceso de límite, en el cual tiende a infinito el 
número de vértices y el polígono regular óptimo tiende a un círculo. 

El razonamiento de Steiner no es completamente adecuado para 
probar la correspondiente propiedad isoperimétrica de la esfera en tres 
dimensiones, El mismo Steiner dió una argumentación más complicada 
y algo distinta, que resulta adecuada lo mismo para tres dimensiones 
que para dos; pero, dado que no puede adaptarse fácilmente de manera 
que proporcione la demostración de la existencia, preferimos omitirla. 
En efecto, la demostración de la propiedad isoperimétrica de la esfera 
es tarea mucho más difícil que la del círculo. Sólo mucho más tarde 
H. A. Schwarz dió por primera vez una demostración completa y rigu- 
rosa en una memoria bastante abstrusa. La propiedad isoperimétrica 
tridimensional puede expresarse mediante la desigualdad 36r V2<A3 
entre el área A y el volumen V de cualquier cuerpo cerrado tridimen- 
sional, verificándose el signo de igualdad sólo para la esfera. 


*IX. PROBLEMAS DE EXTREMOS CON CONDICIONES DE CONTORNO. 
RELACIÓN ENTRE EL PROBLEMA DE STEINER Y 
EL DE LOS ISOPERÍMETROS 


Se obtienen resultados interesantes en los problemas de máximos 
y mínimos, cuando el dominio de la variable está restringido por con- 
diciones de contorno. El teorema de Weierstrass, relativo a que una 
función continua en un dominio compacte alcanza un valor máximo 
y otro mínimo, no excluye la posibilidad de que alcance los valores 
extremos en el contorno del dominio. La función u = x proporciona 
un ejemplo sencillo, casi trivial. Si x no está acotada y puede tomar 
cualquier valor entre —oo y +00, el dominio B de la variable inde- 
pendiente es toda la recta numérica, por lo que la función u = x no 
alcanza en ningún punto un máximo o un mínimo. Pero si el dominio 
B está limitado y se reduce, p. ej., a 0 < x < 1, existe un máximo, 1, 
que la función alcanza en su extremo derecho, y un mínimo, 0, que la 
función alcanza en el extremo izquierdo. Sin embargo, ninguno de 
estos valores extremos está representado por una cumbre o una de- 
presión en la gráfica de la función; no son extremos relativos respecto 
a un entorno completo. Cambian en cuanto se extiende el intervalo, 
puesto que siempre permanecen en los puntos extremos. En cambio, 
una verdadera «cumbre» o «depresión» de una función tiene siempre 
un carácter de máximo o mínimo respecto a un entorno completo del 
punto donde la alcanza y no queda afectada por ligeros cambios en 
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los límites. Un extremo de este tipo persiste, aun cuando varíe libre- 
mente la variable independiente en el dominio B, por lo menos en un 
entorno suficientemente pequeño. La distinción entre esos extremos 
relativos y los que alcanza en el contorno queda aclarada por nume- 
rosos contextos, aparentemente inconexos. Para las funciones de una 
variable, naturalmente, la distinción es la que existe entre las funcio- 
nes monótonas y las que no lo son, lo que no conduce a ninguna ob- 
servación particularmente interesante; pero existen numerosos ejem- 
plos muy significativos de valores extremos alcanzados en el contorno 
del dominio de variabilidad, en el caso de las funciones de varias 
variables. 

Esto puede ocurrir, p. ej., en el problema del triángulo de Schwarz; 
en este caso, el dominio de variabilidad de las tres variables indepen- 
dientes consta de todas las ternas de puntos, una en cada lado del 
triángulo ABC. La solución del problema entraña dos posibilidades: 
o se llega al mínimo, cuando cada uno de los tres puntos, P, Q, R, que 
varían independientemente, se encuentra dentro de los respectivos 
lados del triángulo, en cuyo caso el mínimo está dado por el triángulo 
órtico, o el mínimo se obtiene en la posición de contorno, cuando dos 
de los puntos P, Q, R coinciden con el extremo común de sus respec- 
tivos intervalos, en cuyo caso el «triángulo» mínimo inscrito es la 
altura correspondiente a este vértice contada dos veces. Así, el carác- 
ter de la solución es completamente distinto en uno y otro caso. 

En el problema de Steiner de las tres ciudades, el dominio de 
variabilidad del punto P es todo el plano, del cual pueden conside- 
rarse como formando parte del contorno los puntos A, B y C. También 
aqui aparecen dos casos posibles, que proporcionan tipos enteramente 
distintos de solución. O se alcanza el mínimo en el interior del trián- 
gulo ABC, caso de los tres ángulos iguales, o se obtiene en un punto 
C del contorno. Existe un par de casos análogos para el problema 
complementario. 

Como ejemplo final podemos considerar el problema de los isope- 
rímetros, modificado mediante condiciones restrictivas de contorno. 
Obtendremos así una sorprendente relación entre este problema y el 
de Steiner, y al mismo tiempo el ejemplo quizá más sencillo de un 
nuevo tipo de problema de extremos. En el problema original, la 
variable independiente, o sea, la curva cerrada de longitud dada, 
podía desviarse arbitrariamente de la forma circular, y cualquier curva 
así deformada es admisible, por lo que obtenemos un auténtico míni- 
mo libre o relativo. Examinemos ahora el siguiente problema modi- 
ficado: las curvas C en consideración deberán contener en su inte- 
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rior o pasar por tres puntos dados, P, Q, R, estando dada el área A 
y debiendo hacerse mínima la longitud L. Esto representa una ver- 
dadera condición de contorno. 

Es evidente que si el área dada A es suficientemente grande, los 
tres puntos P, Q, R no afectarán en nada al problema. Siempre que 
el círculo circunscrito al triángulo PQR tenga área menor o igual 
que A, la solución será simplemente un círculo de área A que incluya 
a los tres puntos. Pero, ¿qué ocurre si A es menor? Nos contentare- 
mos con enunciar la solución omitiendo la demostración detallada, 


P 
p P 
R Q ON MaS 
R 0 R Q 


FıG. 231. Fic. 232. Fig. 233. 





FIG. 234. “Fic. 235. 


Fics. 231-35.—TFiguras isoperimétricas que tienden a la solución del problema 
de Steiner. 


aunque no está fuera de nuestras posibilidades. Caractericemos las 
soluciones mediante una sucesión de valores de A que tienden a cero. 
Apenas el valor de A es menor que el área del círculo circunscrito, 
el círculo isoperimétrico primitivo se descompone en tres arcos, todos 
del mismo radio, que forman un triángulo curvilíneo convexo de vér- 
tices P, Q, R (Fig. 232). Este triángulo es la solución y sus dimen- 
siones pueden determinarse por el valor dado de A. Si A continúa 
disminuyendo, aumentará el radio de esos arcos, tendiendo a ser seg- 
mentos rectilíneos, hasta que A es exactamente igual al área del 
triángulo PQR, en cuyo caso la solución es este mismo triángulo. Si 
A sigue disminuyendo, la solución constará otra vez de tres arcos 
circulares, todos del mismo radio y que forman un triángulo de vérti- 
ces P, Q, R (Fig. 233). Si A continúa disminuyendo, llegará un mo- 
mento en el que, para un cierto valor de A, dos de los arcos cóneavos 
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serán mutuamente tangentes en un vértice R. Si A disminuye toda- 
vía más, no será ya posible construir un triángulo curvilíneo del tipo 
anterior. Se presenta un nuevo fenómeno: todavía la solución es un 
triángulo curvilíneo cóncavo, pero uno de los vértices R’ se ha sepa- 
rado del correspondiente vértice R, y la solución es ahora el trián- 
gulo PQR' más el segmento RR’ contado dos veces (puesto que pasa 
de Ra'R' y de R' a R). Este segmento rectilíneo es tangente a los dos 
arcos, que son a su vez tangentes entre sí en R'. Si A sigue decre- 
ciendo, este fenómeno de separación se presentará también en los 
otros vértices. Eventualmente, se obtiene como solución un triángulo 
curvilíneo compuesto por tres-arcos circulares de igual radio, tangentes 
entre sí y que forman un triángulo curvilíneo equilátero P'Q'R', 
además de tres segmentos rectilíneos, contados dos veces cada uno, 
"PP, Q'Q, R'R (Fig. 234). Si, finalmente, A se hace cero, el triángulo 
curvilíneo se reduce a un punto, volviendo a la solución del proble- 
ma de Steiner. Se ve así que esta última circunstancia es el caso límite 
del problema modificado de los isoperímetros. 

Si P, Q, R forman un triángulo obtuso con un ángulo mayor de 
1200, el proceso anterior conduce a la solución del problema de Steiner, 
pues los arcos circulares tienden hacia el vértice del ángulo obtuso. 
Mediante procesos de límite de naturaleza análoga pueden obtenerse 
las soluciones del problema de Steiner generalizado (Figs. 216-218). 


X. EL CÁLCULO DE VARIACIONES 


1. Introducción.—El problema de los isoperímetros es sólo un 
ejemplo, probablemente el más antiguo de todos, de un tipo muy 
amplio de problemas, sobre los que llamó la atención Johann Bernoulli 
en 1696. En Acta Eruditorum, el gran periódico científico de la época, 
propuso el siguiente problema de la braquistocrona: imagínese una 
partícula obligada a deslizarse sin rozamiento a lo largo.de cierta 
curva, que une un punto, A, con otro situado más abajo, B. Si se per- 
mite que la partícula descienda exclusivamente bajo la acción de la 
gravedad, se pregunta qué curva deberá elegirse para que el tiempo 
empleado en el descenso sea mínimo. Es fácil ver que la partícula 
empleará diferentes intervalos de tiempo al variar las trayectorias. 
De ningún modo proporciona la línea recta la trayectoria de tiempo 
mínimo, así como tampoco constituye la solución un arco de circun- 
ferencia o cualquier otra curva elemental. Bernoulli se enorgulleció 
de haber encontrado una solución maravillosa, que no quiso publicar 
inmediatamente para incitar a los grandes matematicos de la época a 
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probar su habilidad en este nuevo tipo de cuestiones matemáticas. 
En particular, desafió a su hermano mayor Jacob, con quien estaba 
entonces profundamente enemistado y a quien públicamente había 
calificado de incompetente para resolver el problema. Los matemáti- 
cos reconocieron inmediatamente que el problema de la braquisto- 
crona era de un carácter enteramente distinto. Mientras que, hasta 
entonces, en los problemas estudiados mediante el cálculo diferencial, 
la cantidad cuyo mínimo se buscaba dependía sólo de una o más 
variables numéricas, en este problema la cantidad que se consideraba, 
es decir, el tiempo necesario para el descenso, dependía de toda la 
curva, lo que constituye una diferencia esencial, que ponía el proble- 
ma fuera del alcance del cálculo diferencial o de cualquier otro mé- 
todo conocido en aquella época. 

La novedad del problema (al parecer no se comprendió claramente 
entonces que el de los isoperímetros es de la misma naturaleza) fas- 


FIG. 236.—La cicloide. 


cinó a los matemáticos contemporáneos, tanto más al conocerse que 
la solución la proporcionaba la cicloide, curva que había sido descu- 
bierta poco tiempo antes. (Recordemos la definición de la cicloide: es 
el lugar de un punto de una circunferencia que rueda sin deslizar 
sobre un recta, según se ve en la figura 236.) Esta curva había sido 
relacionada con algunos interesantes problemas de mecánica, especial- 
mente con la construcción de un péndulo ideal. Huygens había des- 
cubierto que un punto ideal provisto de masa, que oscile sin roza- 
miento bajo la acción de la gravedad en una cicloide vertical, tiene 
un período de oscilación independiente de la amplitud del movimien- 
to. En una trayectoria circular, como la de un péndulo ordinario, esa 
independencia es sólo aproximada, lo que se tenía por un inconve- 
niente en la utilización del péndulo en los relojes de precisión. Se había 
honrado a la cicloide llamándola tautocrona; pero entonces se le 
asignó el nuevo título de braquistocrona. 

2. El cálculo de variaciones. El principio de Fermat en óptica. 
Entre los diferentes métodos de resolver el problema de la braquis- 
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tocrona, que encontraron Bernoulli y otros investigadores, expondre- 
mos el más original. Los primeros métodos eran de un carácter más 
o menos especial, adaptados al problema particular en cuestión. Pero 
no pasó mucho tiempo sin que Euler y Lagrange (1736-1813) desarro- 
llaran métodos más generales para resolver problemas de extremos, 
en los cuales el elemento independiente no era ya una sola variable 
numérica o un número finito de tales variables, sino toda una curva 
o función e incluso un sistema de funciones. Se llamó cálculo de varia- 
ciones al nuevo método que permitía resolver dichos problemas. 

No es posible describir aqui los aspectos técnicos de esta rama de 
la matemática o profundizar en la discusión de problemas concretos. 
El cálculo de variaciones tiene numerosas aplicaciones en física y hace 
ya mucho tiempo que se 
observó que los fenóme- 
nos naturales se ajustan a 
menudo a algún principio 
de máximos y mínimos. 
Como ya hemos visto, 
Herón de Alejandría com- 
prendió que podía deseri- II 
birse la reflexión de un 
rayo luminoso en un espe- 
jo plano mediante un prin- 
cipio de minimo. En el Frc. 237.—Refracción de un rayo luminoso. 
siglo xvir, Fermat dió un 
paso más en esta dirección, al observar que la ley de la refracción de 
la luz puede expresarse también mediante un principio de mínimo. 
Se sabe que la trayectoria de un rayo luminoso, que pasa de un medio 
homogéneo a otro de la misma naturaleza, se desvía en la superficie 
de separación de ambos. Así, en la figura 237, un rayo luminoso que 
parte de P en el medio superior donde la velocidad es v, hacia R, que 
se encuentra en el medio inferior donde la velocidad es w, seguirá la 
trayectoria PQR. La ley empírica encontrada por Snell (1591-1626) 
afirma que la trayectoria consta de dos segmentos rectilíneos, PQ y 
QR, que forman con la normal dos ángulos, a y æ’, determinados por 
la condición: sen a/sen a’ = vjw. Por medio del cálculo, Fermat de- 
mostró que esta trayectoria es tal que el tiempo necesario para que 
el rayo de luz pase de P a R es mínimo; es decir, menor de lo que sería 
si siguiera cualquier otra trayectoria. De esta forma, la ley de refle- 
xión de Herón fué complementada 1600 años más tarde mediante 
otra, de refracción, análoga a la primera e igualmente importante. 
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Fermat generalizó esta ley de tal modo que incluyera superficies 
curvas de separación de los diferentes medios, como ocurre en las 
lentes esféricas. También en este caso se cumple la ley, pues la luz 
sigue una trayectoria tal que requiere un tiempo mínimo, comparado 
con el que sería necesario siguiendo otra trayectoria distinta entre los 
mismos dos puntos. Finalmente, Fermat consideró cualquier sistema 
óptico en el cual la velocidad de la luz varíe de manera determinada 
de un punto a otro, como ocurre en la atmósfera” Dividió el medio 
continuo, pero no homogéneo, en capas paralelas, en cada una de las 
cuales la velocidad de la luz es aproximadamente constante, e imaginó 
que este medio quedaba reemplazado por otro, en el cual la velocidad 
en cada capa es realmente constante. Entonces pudo aplicar nuevamen- 
te su principio, pasando de una capa a otra. Haciendo que el espesor de 
las capas tendiera a cero, obtuvo el principio general de Fermat de la 
óptica geométrica: en un medio no homogéneo, un rayo luminoso que pa- 
sa de un punto a otro sigue aquella trayectoria para la cual es mínimo 
el tiempo respecto al que requiere cualquier otra que una los mismos 
dos puntos. Este principio ha tenido una importante trascendencia, no 
sólo desde el punto de vista teórico, sino en la práctica de la óptica geo- 
métrica. Aplicando a este principio las técnicas del cálculo de variacio- 
nes se obtienen las bases para calcular los sistemas de lentes. 

En otras ramas de la física los principios de mínimo han adquirido 
también una importancia enorme. Se observó que se obtiene el equili- 
brio estable de un sistema mecánico si se dispone de tal forma que su 
«energía potencial» sea mínima. Como ejemplo, consideraremos una ca- 
dena homogénea y flexible, suspendida por sus extremos y sobre la que 
actúa libremente la fuerza de la gravedad. La cadena adoptará aquella 
forma según la cual su energía potencial es mínima. En este caso, la 
energía potencial está determinada por la altura del centro de grave- 
dad respecto a cierto eje fijo. La curva que adopta la cadena en sus- 
pensión se llama catenaria, y tiene cierto parecido con la parábola. 

No sólo las leyes del equilibrio, sino también las del movimiento, 
están dominadas por principios de máximo o mínimo. Fué Euler el 
primero que tuvo ideas claras acerca de estos principios, aunque algu- 
nos temperamentos, inclinados hacia la especulación mística y filo- 
sófica, como Maupertius (1698-1759), no pudieron separar las propo- 
siciones matemáticas de ciertas ideas peregrinas acerca de la «intención 
de Dios de regular los fenómenos físicos mediante un principio gene- 
ral de la más alta perfección». Los principios físicos variacionales de 
Euler, redescubiertos y ampliados por el matemático irlandés W. R. Ha- 
milton (1805-1865), han demostrado ser poderosísimas herramientas 
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en mecánica, óptica y electrodinámica, con numerosas aplicaciones a 
la ingeniería. El desarrollo reciente de la física—relatividad y teoría 
de los cuantos—está lleno de ejemplos que revelan el poder del cálcu- 
lo de variaciones. 

3. El método de Bernoulli y el problema de la braquistocrona. 
El primer método desarrollado por Jacob Bernoulli para tratar el 
problema de la braquistocrona puede comprenderse sin poseer gran- 
des conocimientos técnicos. Se sabe por mecánica que si un grave cae 
desde A sin velocidad inicial, siguiendo una curva C, tendrá en cual- 
quier punto P una velocidad proporcional a y h, siendo h la distancia 
vertical entre A y P; es decir, v=cy/h, donde c es una constante. Re- 
emplacemos ahora el problema dado por otro ligeramente distinto. Di- 
vidamos el espacio en numerosas y delgadas cápas horizontales, cada 
una de espesor d, y supongamos A 
por un momento que la velocidad 
de la partícula en movimiento no 
varía con continuidad, sino por 
pequeños saltos, al pasar de una 
capa a otra; es decir, que en la 
primera capa, adyacente a A, la 
velocidad es cy/d; en la segunda, PSS P 
cy 2d, y en la n-ésima, cynd = 
= cy h, siendo h la distancia vertical de A a P (Fig. 238). Si nos 
limitamos a este problema, sólo existe en realidad un número finito 
de variables. Al ser rectilínea la trayectoria en cada capa, no se plan- 
tea problema de existencia; la solución debe ser una poligonal, y la 
única dificultad consiste en determinar sus vértices. De acuerdo con 
el principio de mínimo de la ley de la refracción simple, en cada par 
de capas sucesivas el movimiento de P a R pasando por Q debe ser 
tal que, suponiendo P y R fijos, Q proporciona la curva de tiempo 
mínimo. Por tanto, puede aplicarse la siguiente «ley de refracción»: 


sen « sen a” 
nd Vi+d 





Por aplicación reiterada de este razonamiento se obtiene la siguiente 
sucesión de igualdades: 


sen «1 sen as 


Via Va ds 


donde an es el ángulo entre la poligonal en la n-ésima capa y la ver- 
tical. 
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Bernoulli supone ahora que el espesor d se hace cada vez más 
pequeño y tiende a cero, de manera que el polígono que se acaba de 
obtener como solución del problema aproximado tiende a la solu- 
ción buscada del problema original. Este paso al límite no afecta a las 
igualdades [1], por lo que Bernoulli concluye que la solución debe ser 
una curva C, que goce de la siguiente propiedad: si a es el ángulo 
formado por la tangente y la vertical en cualquier punto P de C, y h es 
la distancia vertical de P a la horizontal que pasa por A, sen a/yh 
es constante para todos los puntos P de C. Es fácil demostrar que 
esta propiedad caracteriza a la cicloide. 

La «demostración» de Bernoulli es un ejemplo típico de una clase 
de razonamiento matemático, ingenioso y no exento de valor, pero 
que, al propio tiempo, carece de rigor. Existen varias suposiciones 
tácitas en la argumentación cuya justificación sería más complicada 
y engorrosa que la propia demostración; p. ej., se ha supuesto que 
existía una solución C y que la solución del problema aproximado 
tendía a la verdadera. Ciertamente, merece una atenta discusión el 
valor intrínseco de las consideraciones heurísticas de este tipo, pero 
esto nos llevaría demasiado lejos. 

4. Geodésicas en una esfera. Geodésicas y maxi-mínimos.—En la 
introducción de este capítulo mencionamos el problema de determi- 
minar el arco mínimo que une 
dos puntos dados de una super- 
ficie. Sobre una esfera, se de- 
muestra en geometría elemental 
que esas «geodésicas» son arcos 
de círculos máximos. Sean P y 
Q dos puntos (no diametralmen- 
te opuestos) de una esfera, y c el 
menor de los arcos del círculo 
máximo que los une. Se plantea 
entonces la cuestión de saber 
qué representa el arco mayor c’ 
de este círculo máximo. Cierta- 
mente, no proporciona ni la lon- 

Fic. 239.—Geodésicas en una esfera. gitud máxima ni la mínima 

entre todas las curvas que unen 
P con Q, puesto que pueden trazarse entre ambos puntos curvas de 
longitud arbitrariamente grande. La respuesta es que c' resuelve un 
problema de maxi-mínimo. Consideremos un punto § sobre un círculo 
máximo que separe a P y Q; se trata de determinar la curva esférica 
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de longitud mínima que une P con Q pasando por S. Naturalmente, 
el mínimo viene dado por una curva formada por dos pequeños arcos 
de círculo máximo, PS y QS. Busquemos ahora una posición del punto 
S de forma que esta distancia mínima PSQ sea la mayor posible. La 
solución es la siguiente: S debe ser tal que PSQ sea el arco mayor c' 
del círculo máximo PQ. Podemos modificar el problema buscando 
primero la trayectoria de longitud mínima que une P con Q pasando 
por n puntos prefijados Si, Sa, ..., Sn de la esfera y tratar después de 
determinar los puntos S, S2, ..., Sn de tal manera que esta distancia 
mínima sea la mayor posible. La solución viene dada por una tra- 
yectoria sobre el círculo máximo que une P con Q, pero que se arrolla 
tantas veces alrededor de la esfera que pasa exactamente n veces por 
los puntos diametralmente opuestos a P y.Q. 

Este ejemplo de problema de maxi-mínimo es típico de una clase 
muy amplia de cuestiones del cálculo de variaciones que han sido 
estudiadas con gran éxito mediante métodos desarrollados por Morse 
y Otros autores. 


XI. SOLUCIÓN EXPERIMENTAL DE PROBLEMAS DE MÍNIMO. 
EXPERIMENTOS CON PELÍCULAS 


1. Introducción.—Generalmente es muy difícil, y a veces imposi- 
ble, resolver explicitamente los problemas variacionales mediante fór- 
mulas o construcciones geométricas en función de elementos simples 
ya conocidos. En lugar de ello, debemos conformarnos muchas veces 
con demostrar la existencia de una solución bajo determinadas con- 
diciones e investigar después sus propiedades. En múltiples casos, 
cuando dicha demostración de existencia resulta -ser,más. o menos 
dificultosa, es interesante estudiar las condiciones matemáticas del 
problema mediante ciertos artificios físicos o, mejor dicho, considerar 
el problema matemático como una interpretación de un fenómeno 
físico. La existencia de este último representará entonces la solución 
del problema matemático. Naturalmente, esto sólo constituye una 
justificación plausible sin llegar a ser una demostración matemá- 
tica, pues queda todavía una cuestión por dilucidar, a saber: si la 
interpretación matemática del hecho físico es adecuada en sentido 
estricto, o si proporciona sólo una imagen poco apropiada de la reali- 
dad física. Algunas veces tales experimentos, aunque efectuados sólo 
en la imaginación, son convincentes incluso para los matemáticos. En 
el siglo x1x, Riemann descubrió muchos de los teoremas fundamen- 
tales de la teoría de funciones razonando acerca de sencillos experi- 
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mentos relacionados con el flujo de la electricidad en láminas metá- 
licas delgadas. 

En esta sección vamos a discutir, basándonos en demostraciones 
experimentales, uno de los problemas más profundos del cálculo de 
variaciones; el llamado problema de Plateau, debido a que este físico 
belga (1801-1883) llevó a cabo interesantes experimentos sobre el par- 
ticular. El problema en sí mismo es mucho más antiguo, remontán- 
dose su origen hasta las fases iniciales del cálculo de variaciones. En 
su forma más simple consiste en encontrar la superficie de área mí- 
nima limitada por un contorno cerrado dado en el espacio. Discuti- 
remos también ciertos experimentos relacionados con cuestiones 
conexas, todo lo cual servirá para iluminar algunos de nuestros 
resultados anteriores, así como ciertos problemas matemáticos de un 
nuevo tipo. 

2. Experimentos con soluciones jabonosas.—Matemáticamente, el 
problema de Plateau está relacionado con la solución de una ecuación 
en derivadas parciales o con un sistema de tales ecuaciones. Euler 
demostró que todas las superfi- 
cies mínimas (no contenidas en 
un plano) deben tener forma de 
silla de montar, y que su curva- 
tura media! en cada punto ha 
de ser cero. Durante el último 
siglo se probó la existencia de 
solución para numerosos casos 
especiales, pero dicha existencia 
sólo ha sido demostrada recien- 
temente en el caso general por 
J. Douglas y T. Rado. 

Los experimentos de Plateau 
Fic. 240.—Estructura cúbica con una pe- proporcionan inmediatamente 
lícula jabonosa formada por 13 superficies k 

casi planas. soluciones para contornos muy 

generales. Si se sumerge- cual- 

quier contorno cerrado construído con alambre en un líquido de baja 
tensión superficial, al extraerlo, el contorno estará cubierto por una 
película que adopta la forma de una superficie de área mínima. (Se 
supone que puede despreciarse la gravitación y que lo mismo ocurre 





1 La curvatura media de una superficie en un punto P se define de la siguiente manera: 
consideremos la normal a la superficie en P y el haz de planos que pasan por ella. Estos 
planos cortan a la superficie según curvas que, en general, tienen curvatura diferente en P. 
Si consideramos las curvas de curvatura máxima y mínima, se llama curvatura media de 
la superficie P a la media aritmética de aquéllas (en general, los dos planos que dan las 
curvas de curvatura máxima y mínima son perpendiculares). 
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con otras fuerzas que se oponen a la tendencia de la película a adop- 
tar una posición de equilibrio estable mediante la formación de una 
superficie de área mínima, que corresponde al menor valor posible 
de la energía potencial debida a la tensión superficial.) Una buena 
receta para preparar un líquido adecuado es la siguiente: disuélvanse 
10 g de oleato sódico puro en 500 g de agua destilada y mézclense 
15 unidades (en volumen) de esa solución con 11 de glicerina. Las 
películas obtenidas con esta solución sabre estructuras de alambre de 
cobre son relativamente estables. Las estructuras no deberán sobre- 
pasar un diámetro total de 10 a 12 cm. 

Con este método es muy fácil «resolver» el problema de Plateau, 
dando a la estructura de alambre la forma deseada. Se obtienen muy ` 
bellos modelos con estructuras de alambre de forma poligonal, for- 
madas por una sucesión de aristas de un poliedro regular. En particu- 
lar, es interesante sumergir una estructura cúbica completa en el li- 
quido. Resulta primero un sistema de diferentes superficies que se 
cortan mutuamente, formando ángulos de 120%, (Si se retira cuida- 
dosamente el cubo, existirán 13 superficies aproximadamente planas.) 
Después podemos perforar y destruir varias de estas superficies hasta 
que quede una sola limitada por un polígono cerrado. De esta manera 
pueden formarse bellísimas superficies. El mismo experimento puede 
hacerse con un tetraedro. 

3. Nuevos experimentos sobre el problema de Plateau.—El pro- 
pósito que se persigue con estos experimentos es mucho más amplio 
que el de las demostraciones originales de Plateau. En los últimos 
años se ha estudiado el problema de las superficies mínimas, no sólo 
con uno sino con ún número cualquiera de contornos, siendo además 
la estructura topológica de la superficie mucho más complicada; p. ej., 
puede ser una superficie- de una sola cara o de un género diferente 
de cero. Estos problemas más generales proporcionan una asombrosa 
variedad de fenómenos geométricos que pueden ponerse de manifiesto 
mediante experimentos con películas de solución jabonosa, A este res- 
pecto, es sumamente interesante efectuar los experimentos con estruc- 
turas de alambre flexible y estudiar el efecto de las deformaciones 
del contorno dado sobre la película. 

Describiremos varios ejemplos: 

1) Si el contorno es una circunferencia obtenemos un disco circu- 
lar plano. Si deformamos continuamente el contorno, parece que la 
superficie mínima debería mantener siempre el carácter topológico de 
un disco, pero no ocurre así. Si se deforma el contorno hasta que 
adopte la forma indicada en la figura 241, obtenemos una superficie 
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mínima que ya no es simplemente conexa como el disco, sino que se 
ha convertido en una cinta de Moebius de una sola cara. Inversamente, 
podemos iniciar nuestro experimento con esta estructura y una pelí- 





Fic, 241.—Cinta de Moebius de una sola cara. Fra. 242. —Superficie de dos caras. 


cula de solución con la forma de una superficie de Moebius, y defor- 
mar la estructura mediante agarraderas soldadas a la misma (figu- 
ra 241). En este experimento llega un momento en que cambia de 


K 


FIG. 243. — Sistema de tres 
superficies. 


repente el carácter topológico de la película, 
y la superficie adquiere nuevamente el 
tipo de un disco simplemente conexo (figu- 
ra 242). Invirtiendo la deformación, se 
obtiene de nuevo una superficie de Moe- 
bius. En este experimento alternativo de 
deformación, la transformación de la super- 
ficie simplemente conexa en la cinta de 
Moebius ocurre en una etapa posterior. 
Esto prueba que debe existir toda una 
gama de diferentes formas del contorno, 
para las cuales la superficie de Moebius y 
la simplemente conexa son estables; es 
decir, proporcionan mínimos relativos. Pero 


cuando la superficie de Moebius tiene un área mucho menor que la otra, 
esta última resulta demasiado inestable para que pueda formarse. 

2) Podemos producir una superficie mínima de revolución entre 
dos circunferencias. Después de retirar la estructura de alambre de la 
solución, encontramos, no una superficie simple, sino tres superficies 
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que se cortan bajo ángulos de 1200, una de las cuales es un simple 
disco circular paralelo a los círculos del contorno (Fig. 243). Al des- 
truir esta superficie intermedia, aparece la clásica catenoide [super- 
ficie que se obtiene por revolución de la catenaria (pág. 392) alrede- 
dor de una recta perpendicular a su eje de simetría]. Si se separan las 
dos circunferencias del contorno, llega un momento en que es inesta- 
ble la superficie mínima doblemente conexa (catenoide), y en este 
momento se convierte en dos discos distintos. Naturalmente, el fenó- 
meno no es reversible. i 

3) Otro ejemplo interesante lo proporcionan las estructuras de las 
figuras 244 a 246, sobre las cuales pueden extenderse tres superficies 
mínimas diferentes. Cada una está limitada por la misma curva sim- 





F1G. 244. FIG. 245. Fic, 246. 
Estructura que produce tres superficies distintas, de géneros 0 y 1. 


ple cerrada; una (Fig; 244) tiene género 1, mientras que las otras dos 
son simplemente conexas y, en cierto modo, simétricas. Estas dos últi- 
mas tienen igual área si el contorno es completamente simétrico. Pero 
si no es asi, una de ellas proporciona el mínimo absoluto del área y la 
otra sólo da un mínimo relativo, siempre que el mínimo se busque 
entre las superficies simplemente conexas. La posibilidad de la solu- 
ción de género 1 depende de que, al admitir superficies de ese tipo, es 
posible obtener áreas menores que en el caso en que se exija que la 
superficie sea simplemente conexa. Deformando radicalmente la es- 
tructura. de alambre, debe llegar un momento en que esto ya no es 
posible; entonces, se hace cada vez mayor la inestabilidad de la super- 
ficie de género 1, transformándose repentina y discontinuamente en 
la superficie simplemente conexa y estable, representada en las figu- 
ras 245 y 246. Si iniciamos el experimento con una de esas superficies 
simplemente conexa (Fig. 246), podemos deformarla de tal manera 
que la otra superficie representada en la figura 245, que es también 
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simplemente conexa, sea mucho más estable. La consecuencia es que, 
en un cierto momento, se producirá una transición discontinua de la 
una a la otra. Invirtiendo lentamente la deformación, volvemos a la 





FIG. 247. —Superficie mínima de una sola cara, de estructura topológica superior 
y contorno único. 


posición inicial de la estructura, aunque ahora aparece la otra super- 

ficie. Podemos repetir el fenómeno en dirección opuesta, obteniendo 

alternativamente, mediante transformaciones discontinuas, ambos 

tipos. Si se procede con cuidado, es posible 

transformar discontinuamente una de las dos 

soluciones simplemente conexa en la de gé- 

nero 1. Con este fin, debemos acercar todo lo 

posible las partes en forma de disco, con lo 

"A que la superficie de género 1 adquiere una 

JH notable estabilidad. Durante este experimen- 

to, ocurre algunas veces que aparecen pri- 

LES mero películas intermedias dé solución, que 

AD es necesario destruir antes que aparezca la 
superficie de género 1. 

Fic. 248. —Curvas que o P RS 

se cruzan. Este ejemplo muestra no sólo la posibili- 

dad de la existencia de diferentes soluciones 

del mismo carácter topológico, sino también de otros tipos distintos en 

la misma estructura de alambre. Además, se deduce de nuevo la posi- 

bilidad de transformaciones discontinuas de una solución en otra, al 

variar con continuidad las condiciones del problema. Es fácil cons- 

truir modełos más complicados de la misma clase y estudiar experi- 

mentalmente su comportamiento. 

Un fenómeno interesante es la aparición de superficies mínimas 

limitadas por dos o más curvas cerradas que se cruzan. Para dos cir- 

cunferencias se obtiene la superficie representada en la figura 248. Si, 
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en este ejemplo, se colocan los círculos de forma que sean perpendicu- 
lares entre sí y que la recta de intersección de sus planos sea un diá- 
metro común, aparecerán dos formas simétricamente opuestas de esta 
superficie, con igual área. Si se varía ligeramente la posición mutua 
de ambos círculos, la superficie variará continuamente, si bien para 
cada posición existe sólo una superficie mínima absoluta, siendo la 
otra un mínimo relativo. Si se altera la posición de ambos círculos 
de tal modo que se forme el mínimo relativo, llegará un momento en 
que se transforme discontinuamente en el mínimo absoluto. En este 
caso ambas superficies mínimas posibles tienen el mismo carácter to- 
pológico, como las de las figuras 245 y 246, cada una de las cuales 
puede transformarse discontinuamente en la otra mediante una leve 
deformación de la estructura. 

4. Soluciones experimentales de otros problemas matemáticos.—De- 
bido a la acción de la tensión superficial, una película líquida sólo está 
en equilibrio estable cuando su área es mínima. Es ésta una fuente 
inagotable de experimentos, plenos de significado matemático. Si se 
permite que alguna parte del contorno de la película se mueva libre- 





Fic. 249. — Demostración de la conexión mínima entre cuatro puntos. 


mente sobre superficies dadas, la película será perpendicular en dicho 
contorno a la superficie prescrita. 

Podemos utilizar este fenómeno para obtener curiosas demostra- 
ciones del problema de Steiner y sus generalizaciones (véanse pági- 
nas 364-71). Dos placas paralelas de vidrio o de algún material plás- 
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tico transparente están unidas mediante tres o más barras perpendicu- 
lares. Si sumergimos este artificio en una solución jabonosa, al extraer- 
lo nuevamente veremos que la película forma un sistema de planos 
verticales entre las placas que unen las barras citadas. La proyección 
que aparece sobre las placas de vidrio constituye la solución del pro- 
blema considerado en la página 369, 

Si las placas no son paralelas, o las barras no son perpendiculares 
a las mismas, o bien se hace uso de placas curvadas, las curvas for- 





Fıg, 250, — Conexión minima entre cinco puntos. 


madas por la película sobre las placas no serán ya rectilíneas, y cons- 
tituyen ilustraciones de nuevos problemas variacionales. 

El aspecto de la intersección de tres hojas de una superficie mí- 
nima que se cortan bajo ángulos de 120% puede considerarse como una 
generalización a más dimensiones de ciertos fenómenos relacionados 
con el problema de Steiner. Esto resulta evidente si, p. ej., unimos 
dos puntos del espacio, A y B, mediante tres curvas, y estudiamos 
el sistema estable correspondiente de películas de solución jabonosa. 
Como caso más sencillo consideremos que una de las curvas es el 
segmento rectilíneo AB, y las otras, dos arcos circulares congruentes. 
El resultado aparece en la figura 251. Si los planos de los arcos forman 
un ángulo menor de 1200, se obtienen tres superficies que se cortan 
bajo ángulos de 1200; si se giran los dos arcos, de tal modo que aumen- 
te el ángulo formado, la solución cambia continuamente hasta con- 
vertirse en dos segmentos circulares planos. 
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Unamos ahora A y B mediante tres líneas más complicadas; como 
ejemplo tomaremos tres quebradas, cada una de ellas compuesta por 
las tres aristas del mismo cubo que unen dos vértices opuestos diago- 
nalmente. Se obtienen así tres superficies congruentes que se cortan 





FiG. 251. —Superficies que se cortan bajo ángulos de 120°, tendidas entre tres 
alambres que unen dos puntos. 





FiG. 252, — Tres quebradas que unen dos puntos. 


en la diagonal del cubo. (Se consigue este sistema de superficies a 
partir del representado en la figura 240, destruyendo las películas 
adyacentes a tres aristas adecuadamente elegidas.) Si podemos des- 
plazar las quebradas que unen A con B, veremos que la línea de 
triple intersección se ha convertido en una curva, pero conservándose 
los ángulos de 120% (Fig. 252). 
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Todos los casos en que se cortan tres superficies mínimas según 
curvas determinadas son, fundamentalmente, de naturaleza análoga, 
y constituyen generalizaciones del problema plano de unir n puntos 
mediante un sistema mínimo de líneas. 

Finalmente, debemos decir algunas palabras sobre las burbujas de 
jabón. La burbuja esférica de jabón prueba que entre todas las super- 
ficies cerradas que incluyen un volumen dado (definido por el aire 
encerrado en ella), la esfera tiene superficie mínima. Si consideramos 
burbujas de jabón de volumen dado, que tienden a contraerse hasta 
adquirir una superficie mínima, pero cuyas transformaciones están 
restringidas por ciertas condiciones, las superficies resultantes no 





*FiG. 293. — Demostración de que el círculo es la figura de perímetro mínimo 
entre las de igual área. 


serán esferas, sino superficies de curvatura media constante, de las 
cuales la esfera y el cilindro circular constituyen ejemplos particulares. 

Por ejemplo, introduzcamos una burbuja de jabón entre dos planos 
paralelos de cristal, que se han humedecido previamente. con la solu- 
ción jabonosa. Cuando la burbuja toca una de las placas, adopta súbi- 
tamente la forma de una semiesfera. En cuanto toca la otra, se trans- 
forma instantáneamente en un cilindro circular, demostrando así, de 
notabilísima manera, la propiedad isoperimétrica del círculo. La clave 
de este experimento consiste en que la película de solución jabonosa 
se ajusta verticalmente a la superficie. Formando burbujas de jabón 
entre dos placas unidas entre sí mediante barras perpendiculares, se 
puede dar una demostración experimental de los problemas discuti- 
dos en las páginas 387-89. 

Podemos estudiar el comportamiento de la solución del problema 
isoperimétrico aumentando o disminuyendo el contenido de aire de 
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la burbuja mediante un tubo provisto de una punta muy fina. Absor- 
biendo el aire, no obtenemos, sin embargo, las figuras de la página 388, 
que consisten en arcos circulares tangentes entre si. Al disminuir el 
volumen de aire contenido, los ángulos del triángulo curvilíneo no 
disminuirán (teóricamente) por debajo de 120%, Resultan las configu- 
raciones indicadas en las figuras 254 y 255, que, a su vez, tienden 
a los segmentos rectilíneos de la figura 235 al tender el área a cero. 
La razón matemática de la imposibilidad de formar arcos tangentes 
con soluciones jabonosas radica en el hecho de que tan pronto como 


P P 


Frias. 254 y 255. — Figuras isoperimétricas con condiciones de contorno. 


la burbuja se separa de los vértices, las líneas que los unen no deben 
contarse dos veces. Las figuras 256 y 257 ilustran el resultado de estos 
experimentos. 


*Ejercicio: Estúdiese el correspondiente problema matemático de hallar un 
triángulo curvilíneo de área dada y tal que su perímetro, más los tres segmentos 
que unen los vértices a tres puntos dados, tenga longitud mínima. 


Una estructura cúbica, en cuyo interior insuflemos una burbuja, 
proporcionará superficies de curvatura media constante y de base 
cuadrática, si la burbuja se expande fuera de la estructura. Si se 
extrae aire de ella mediante una pajita, se obtienen bellísimas estruc- 
turas que se transforman en la representada en la figura 258. Los 
fenómenos de estabilidad y transición entre los diferentes estados de 
equilibrio son una fuente de experimentos sumamente instructivos 
desde el punto de vista matemático. Los experimentos aclaran la 
teoría de los valores estacionarios, puesto que puede conseguirse que 
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las transiciones sean de tal naturaleza que conduzcan a un equilibrio 
inestable, lo que constituye un estado estacionario. 

Por ejemplo, en la configuración cúbica de la figura 240 aparece 
una simetría, ya que un plano vertical en el centro une las doce super- 
ficies que salen de las aristas. De ahí que deban existir por lo menos 
otras dos posiciones de equilibrio, una con un cuadrado horizontal y la 
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otra con un cuadrado vertical. En efecto: soplando aire contra las 
aristas de este cuadrado mediante un tubo muy fino, se puede reducir 
la estructura a una posición tal que el cuadrado se reduzca a un punto: 
el centro del cubo. Esta posición de equilibrio inestable se transforma 
inmediatamente en otra estable, que se deduce de la primera me- 
diante una rotación de 900, 

Puede efectuarse un experimento similar que demuestra el resul- 
tado ya obtenido del problema de Steiner para cuatro puntos que 
forman un cuadrado (Figs. 219 y 220). 
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Si deseamos obtener las soluciones de tales problemas como casos 
límites de los isoperimétricos (p. ej., si queremos conseguir la figu- 
ra 240 a partir de la 258), debemos extraer parte del aire contenido 
en la burbuja. Pero la figura 258 es completamente simétrica, y su 
límite, al tender a cero el contenido de la burbuja, será un sistema 
simétrico de 12 planos, que se cortan en el centro. Es posible observar 





FiG. 258. 


realmente este fenómeno, pero la configuración que se obtiene como 
limite no es estable y se transformará en una de las representadas en 
la figura 240. Utilizando un líquido algo más viscoso que el descrito 
anteriormente, puede observarse fácilmente todo el fenómeno. Lo 
expuesto demuestra que ni siquiera en el terreno de la física la solu- 
ción de un problema precisa depender continuamente de los datos 
iniciales; pues en el caso límite correspondiente al volumen cero, la 
solución de la figura 240 no es límite de la dada por la 258, para el 
volumen e, cuando e tiende a cero. 


CAPÍTULO VIII 
EL CÁLCULO INFINITESIMAL 


Introducción.—Con una simplificación absurda y excesiva de los 
hechos, se atribuye a veces a dos hombres, Newton y Leibniz, la «in- 
vención» del cálculo infinitesimal. En realidad, es el producto de una 
larga evolución que ni iniciaron ni dieron fin, pero en la cual desem- 
peñaron un papel decisivo. Diseminado por la Europa del siglo xvii 
se encontraba un grupo de científicos animosos, que en su mayor 
parte no pertenecían a ningún centro de enseñanza, y que se proponían 
continuar la obra matemática de Galileo y Kepler. Estos hombres 
mantenían estrecho contacto entre sí mediante correspondencia postal 
y viajes. Su atención se concentraba alrededor de dos problemas prin- 
cipales. Primero, el problema de las tangentes: la determinación de las 
tangentes a una curva dada; esto es, el problema fundamental del 
cálculo diferencial. Segundo, el problema de las cuadraturas: determi- 
nar el área encerrada por una curva dada; o sea, el problema funda- 
mental del cálculo integral. El gran mérito de Newton y Leibniz con- 
siste en haber reconocido claramente la íntima conexión entre ambos 
problemas. En sus manos, los nuevos métodos unificados se convirtie- 
ron en poderosos instrumentos científicos. Gran parte del éxito se 
debió a la maravillosa notación simbólica ideada por Leibniz. Su éxito 
no queda disminuido en forma alguna por el hecho de hallarse entre- 
mezclada su obra con ideas poco claras e insostenibles, que pudieron 
inducir a perpetuar la falta de precisión en aquellas mentes que pre- 
fieren el misticismo a la claridad. Newton, que indudablemente era de 
superior categoría científica, parece haber experimentado una intensa 
influencia de Barrow (1630-1677), su maestro y predecesor en Cam- 
bridge. Leibniz era más bien un dilettante. Abogado brillante, diplo- 
mático, filósofo, y una de las inteligencias más activas y versátiles de 
su siglo, aprendió la nueva matemática, en un tiempo increíblemente 
corto, del físico Huygens, mientras se encontraba en París en una 
misión diplomática. Muy poco tiempo después publicó resultados que 
contienen el núcleo del cálculo infinitesimal moderno. Newton, cuyos 
descubrimientos son muy anteriores, se resistió a publicarlos. Además, 
aunque había encontrado muchos de los resultados en su obra maes- 
tra, los Principia, por los métodos del cálculo, prefirió presentarlos en 
el estilo de la geometría clásica, por lo que casi no aparece rastro del 
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cálculo infinitesimal, al menos en forma explícita, en los Principia. 
Sólo más tarde se publicaron sus investigaciones sobre el método de 
«Huxiones». Muy pronto sus admiradores iniciaron una guerra cruel 
sobre cuestiones de prioridad con los amigos de Leibniz. Acusarón a 
éste último de plagiario, aunque en una atmósfera saturada de las 
nuevas teorías nada era más natural que el descubrimiento simultáneo 
e independiente. Aquella polémica sobre la prioridad en la «invención» 
del cálculo constituye un desdichado ejemplo del valor excesivo dado 
a las cuestiones de precedencia y derecho de propiedad intelectual, 
muy adecuadas para envenenar la atmósfera de la vida científica. 

En el análisis matemático del siglo xvii y gran parte del xvin 
pareció haberse abandonado por completo el ideal griego de razona- 
miento claro y riguroso. La «intuición» y el «instinto» reemplazaron a 
la razón en numerosos casos importantes. Esto fomentó la fe sin dis- 
criminación en el poder sobrehumano de los nuevos métodos. Se creía 
generalmente no sólo innecesaria, sino imposible, una clara presen- 
tación de los resultados del cálculo infinitesimal. De no haber estado 
la nueva ciencia en manos de un grupo restringido de hombres extre- 
madamente competentes, habrían resultado serios errores y aun de- 
sastres. Estos científicos se dejaban guiar por un sentido profunda- 
mente instintivo, que les impedía perderse por completo. Pero cuando 
la Revolución francesa abrió el camino hacia una inmensa extensión 
de la cultura superior, cuando aumentó el número de personas que 
deseaban participar en la actividad científica, ya no pudo posponerse 
la revisión crítica del nuevo análisis. El siglo xix llevó felizmente 
a cabo esa tarea, y hoy día puede enseñarse el cálculo infinitesimal sin 
ninguna traza de misterio y con completo rigor. No existe actualmente 
ninguna razón para que las personas educadas no entiendan esté 
instrumento básico de las ciencias. 

En este capítulo nos proponemos dar una introducción elemental, 
en la cual insistiremos en la adecuada comprensión de los conceptos 
fundamentales, más que en la manipulación formal. Utilizaremos 
constantemente un lenguaje intuitivo, pero siempre de manera que se 
mantenga la conexión con los conceptos precisos y la claridad del 
procedimiento. 


I. LA INTEGRAL 


1. El área como límite.—Para poder calcular el área de una figura 
plana elegimos como unidad de drea un cuadrado de lado igual a la 
unidad de longitud. Si ésta es un centímetro, la unidad correspon- 
diente de área será el centímetro cuadrado; es decir, un cuadrado de 
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lado igual a un centímetro. Partiendo de esta definición es muy fácil 
calcular el área de un rectángulo. Si p y q son las longitudes de dos 
lados adyacentes, medidas con la unidad de longitud, la superficie del 
rectángulo es igual a pg unidades de área, o más brevemente, el área 
es igual al producto pq. Esto es válido para p y q arbitrarios, raciona- 
les o no. Si p y q son racionales, se obtiene este resultado escribiendo 
p = mjn, q = mjn’, siendo m, n, m’ y n’ números enteros. Hallare- 
mos entonces la medida común 1/N = 1/nn’ de ambos lados, por lo 
que p =mn' «+ 1/N, q = nm + 1/N. Finalmente, subdividiremos el rec- 
tángulo en pequeños cuadrados de lado 1/N y área 1/N2. El número 
de tales cuadrados será nm’ + mn', y el área total, nm'mn' + 1/N2 = 
= nmímn' [n2n'? = mjn - m'[n' = pq. Si p y q son irracionales, se ob- 
tiene el mismo resultado reemplazando primero p y q por números 
racionales aproximados pr y qr, respectivamente, y haciendo después 
tender Pr y qr hacia p y q. 

Geométricamente es evidente que el área de un triángulo es igual 
a la mitad de la del rectángulo con la misma base, b, y la misma al- 
tura, h, por lo que el área del triángulo viene dada por la expresión 
usual 1/2 bh, Cualquier dominio plano, limitado por una o varias poli- 
gonales, puede descomponerse en triángulos, por lo que su área puede 
obtenerse como suma de las de éstos, 

Se plantea la necesidad de un método más general de calcular 
áreas cuando investigamos el área de una figura no limitada por rectas, 
sino por curvas; p. ej., ¿cómo determinaremos el área de un disco 
circular o de un segmento de parábola? Esta cuestión crucial, punto 
de partida del cálcuio integral, fué objeto de las investigaciones de 
Arquímedes, en el siglo 11 a. de J. C., quien las calculó mediante un 
proceso «exhaustivo». Con Arquímedes y los grandes matemáticos 
hasta la época de Gauss, podemos adoptar la «ingenua» actitud de que 
las áreas curvilíneas son entes dados intuitivamente, y que la cuestión 
no consiste en definirlas, sino en calcularlas (wéase, sin embargo, la 
discusión de la pág. 473). Inscribamos en el dominio otro dominio 
aproximado de contorno poligonal, cuya área está bien definida, y 
que representa aproximadamente al primero. Eligiendo otro dominio 
poligonal que incluya al anterior, obtenemos una aproximación mejor 
del dominio dado, y procediendo de esta manera podemos paulati- 
namente agotar toda la superficie y obtener el área buscada como 
límite de las áreas de una sucesión de dominios poligonales inscritos 
cuyo número de lados crece indefinidamente. De esta manera puede 
calcularse el área del círculo de radio 1; su valor numérico se designa 
mediante el símbolo v. 


SEC. 1] LA INTEGRAL 411 


Arquímedes siguió este sistema para obtener el área del círculo y 
del segmento parabólico. Durante el siglo xvir se resolvieron así mu- 
chos «otros casos. En cada uno de ellos el cálculo efectivo del límite 
dependía de algún procedimiento ingenioso, especialmente adaptado 
para ese problema particular. Uno de los principales éxitos del cálculo 
consistió en reemplazar esos procedimientos especiales y restringidos 
de obtener el área por un método potente y general. 

2. La integral.—El primer concepto fundamental del cálculo es el 
de integral. En lo que sigue entenderemos la integral como la expresión 
mediante un límite del área limitada por una curva. Dada una función 
continua y positiva, y = f(x) p. ej., y = x? o y = 1 + cos x, conside- 
remos el dominio así limitado: inferiormente, por el segmento del eje 
de las x, desde la abscisa a hasta otra mayor b; lateralmente, por las 
perpendiculares al eje de las x en esos puntos; y superiormente, por 
la curva y = f(x). Nos proponemos calcular el área A de ese dominio. 

Puesto que, en general, ese dominio no puede descomponerse en 
rectángulos o triángulos, no se dispone de una expresión inmediata 
del área A que permita su cálcu- 
lo explícito. Pero podemos calcu- 
lar un valor aproximado de A, 
y representar así A como un lí- 
mite, de la siguiente manera: 
dividimos el intervalo desde 
x = a hasta x = b en cierto nú- 
mero de pequeños subintervalos; 
levantamos perpendiculares en 
cada uno de los puntos de sub- Fic. 259.—La integral como área. 
división, y reemplazamos cada 
franja del dominio bajo la curva por un rectángulo cuya altura se eli- 
ge entre las ordenadas máxima y mínima de la curva en esa franja. La 
suma S de las áreas de estos rectángulos proporciona un valor aproxi- 
mado de la verdadera área A bajo la curva. La exactitud de este pro- 
cedimiento será tanto mejor cuanto mayor sea el número de rectán- 
gulos y más pequeña: la anchura de cada uno de ellos. Así podemos 
definir el área verdadera como un límite; si formamos una sucesión, 





Sı, Sa, Sa, ***, (11 


de aproximaciones rectangulares al área bajo la curva, de tal manera 
que la base del rectángulo más ancho de Sy tienda a O al aumentar n, 
entonces la sucesión [1] tiende al límite A; es decir: 


Sp> A, [2] 
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siendo este límite A, o sea, el área bajo la curva, independiente de la 
elección particular de la sucesión [1], siempre que las anchuras de los 
rectángulos de aproximación tiendan a cero. (Así, p. ej., puede dedu- 
cirse Sn de Sp-1 agregando uno o más puntos nuevos de subdivisión 
a los que definen Sp-1, O bien la elección de los puntos de subdivisión 
de Sn puede ser enteramente independiente de la correspondiente a 
Sn-1.) Por definición, llamamos integral de la función f(x) desde a 
hasta b al área A del dominio expresada por este proceso de límite, y se 
designa por un símbolo especial, el «signo integral», que se escribe: 


b 
A -f f(x) dx. [3] 


a 

Leibniz introdujo el símbolo f, la «dx» y el nombre de «integral» 
para sugerir la manera como se obtiene el límite. Para explicar esta 
notación debemos repetir con más detalle el proceso de aproximación 
al área A. Al propio tiempo, la formulación analítica del proceso de 
límite nos permitirá prescindir de las hipótesis restrictivas f(x) > 0 
y b >a, y eliminar finalmente el concepto intuitivo de área como 
base de nuestra definición de integral (esto último se hará en el suple- 
mento a este capítulo). 

Dividamos el intervalo (a, b) en n intervalos parciales, que, para 
mayor sencillez, supondremos todos de igual amplitud, (b — a)/n. De- 
signaremos los puntos de subdivisión por 

ba 
Xo = 4, xı = 4a + a> 


2(b — ba 
aa a ke 











Para representar la cantidad (b — a)/n, diferencia entre dos valores 

de x consecutivos, introduciremos 

la notación Ax (léase «delta x»): 
b-—a 


Az = 





= Tj+1 — Tj, 


en la cual el símbolo A significa 
simplemente «diferencia» (es un 
«operador» y no debe confundirse 
con un número). Podemos elegir 
como altura de cada rectángulo 





FiG. 260.— Aproximación del área por . De 
pequeños rectángulos. de aproximación el valor y = f(x) 


en el extremo derecho del sub- 


intervalo; entonces la suma de las áreas de estos rectángulos será: 
Sa = f(11) © Ax + [(03) + Ax ++: + iEn) > Ax, [4] 
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que se escribe abreviadamente así: 
Sn z> Kap- Az, [5] 
j=1 


n 
Aquí el símbolo 2 (léase «sigma desde j = 1 hasta n») representa la 
j=1 
suma de todas las expresiones obtenidas al dar a j sucesivamente los 
valores 1, 2, 3, 4, ..., n. 
Puede verse la utilidad del uso del símbolo > para expresar en forma con- 


cisa el resultado de una suma en los ejemplos siguientes. 


10 
2430 A, 
j=2 


n 
142434 oh 
j=1 
n 
12 + 24 324 +... +=), 
j=1 
n 
ag + a+ + aqt =) ag, 
j=1 
n 


a + (a + d) + (a + 2d) ++. + (a + nd) =) (a + ja). 
j=0 
Formemos ahora una sucesión de dichas aproximaciones Sy en 
las cuales n aumenta indefinidamente, con lo que el número de tér- 
minos en cada suma [5] aumenta, mientras que cada uno de los tér- 
minos [(x¡)Ar tiende a cero, debido a la presencia del factor Ar = 
= (b — a)/n. Al aumentar n esta suma tiende al área A, 


n b 
A = lím y fx Ax -f f(x) dx. [6] 


j=1 
Leibniz expresó simbólicamente este paso al límite de la suma 
aproximada Sn a A reemplazando el signo de sumación > por f, y 
el símbolo de diferencia A por d. (El símbolo y de sumación se escri- 


bía generalmente S en tiempos de Leibniz, y el símbolo f es simple- 
mente una S estilizada.) Aunque el simbolismo de Leibniz sugiere muy 


COURANT.—15 
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bien la manera de obtener la integral como límite de una suma finita 
es necesario tener cuidado y no dar demasiada importancia a lo que, 
después de todo, es sólo un puro convenio respecto a la forma de 
expresión del límite. En los primeros tiempos del cálculo, cuando 
todavía no se había entendido de una forma precisa el concepto de 
límite y ciertamente no siempre se le tenía presente, se solía explicar 
el concepto de integral diciendo que «se reemplaza la diferencia finita 
Ax por la cantidad infinitamente pequeña dx, siendo la integral la 
suma de las infinitas cantidades infinitamente pequeñas f(x) dx». Aun- 
que lo infinitamente pequeño tiene un cierto atractivo para los espi- 
ritus inclinados a la especulación, este concepto ha sido desplazado 
de la matemática moderna. No se llega a ningún resultado útil ro- 
deando la noción clara de integral de una niebla de frases sin sentido. 
El mismo Leibniz se dejó arrastrar muchas veces por el poder de 
sugestión de sus símbolos, que actúan como sí denotaran una suma 
de cantidades «infinitamente pequeñas», con las cuales, sin embargo, 
se puede operar hasta cierto punto como con las cantidades ordinarias. 
En efecto, se acuñó el vocablo integral para indicar que la totalidad 
del área A se compone de partes «infinitesimales» f(x) dx. De todas for- 
mas, hubo de pasar casi un siglo, después de Leibniz y Newton, para 
comprender claramente que la definición de integral se basa sólo en el 
concepto de límite, Permaneciendo firmemente en dicha base podemos 
evitar todas las nebulosidades, todas las dificultades y todos los dispa- 
rates que tanto perturbaron el desarrollo del cálculo en sus comienzos. 

3. Observaciones generales sobre el concepto de integral. Defini- 
ción general.—En nuestra definición geométrica de la integral como 
área hemos supuesto explicitamente que f(x) no es negativa en el inter- 
valo [a, b] de integración; 
es decir, que ninguna par- 
te de la gráfica de la curva 
se encuentra por debajo 
del eje de las x. Pero, en 
nuestra definición analíti- 
ca de la integral como lí- 
mite de una sucesión de 
sumas Sp, esa hipótesis 
resulta superflua. Tomamos simplemente las pequeñas cantidades 
f(x) - Ax, formamos su suma y pasamos al límite, procedimiento que 
sigue teniendo sentido aunque algunos de los valores f(x;) sean nega- 
tivos. La interpretación geométrica mediante el área (Fig. 261) nos 
dice que la integral de f(x) es la suma algebraica de las áreas limitadas 





FiG. 261.— Áreas positivas y negativas. 
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por la gráfica y el eje de las x, contando las que se encuentran por 
encima del eje como positivas, y como negativas las que se encuen- 
tran por debajo. b 
Puede ocurrir que en las aplicaciones aparezcan integrales Í f(x) dx 
a 


en las que b sea menor que a, de forma que la diferencia (b — a)ín =Azx 
resulte negativa. En nuestra definición analítica tenemos que f(x;)- Ar 
es negativo si f(1,) es positiva y Ax negativo, etc. En otras palabras, 
el valor de la integral será el valor opuestd del dela integral de b a a. 
Así, pues, se tiene la sencilla regla: 


b a 
f f(x) dx = -f f(x) dx. 


Debemos subrayar que el valor de la integral sigue siendo el mismo, 
aunque nos limitemos a puntos de subdivisión equidistantes; o lo que 
es lo mismo, a diferencias de x iguales Ar = tj+1 — xj. Podemos elegir 
los xj, de otro modo, de forma que las diferencias Ar, = 1j+1 — x, no 
sean iguales entre sí (por lo que será necesario distinguirlas mediante 
subíndices). Aun en este caso las sumas 


Sa = [(21)AXo + MAR + >> + MADÁLA-1 
y también las sumas 
S'n = fitgJAZy + HIYAXL + `t + [En-1)ALn-1 


tienden al mismo límite; o sea, al valor de la integral | fGrjdx, bas- 


tando tomar la precaución de que, al aumentar n, todas las diferen- 
cias Arj = 1j+1 — qj tiendan a cero, de tal manera que la mayor de 
ellas para cierto valor de n tienda a cero al aumentar n. 

De acuerdo con todo esto, la definición definitiva de integral está 
dada por 


n 


d 
f f(£) dx = im > f (w) Az; [6a] 
j 


=1 


cuando n —> œo. En este límite, vj puede indicar cualquier punto del 
intervalo xj < Vj < 1;,1, con la única restricción de que el mayor: 
intervalo Ax, = j+; — x; tienda a cero al crecer n. 

La existencia del límite [6a] no necesita demostración si supone- 
mos definido el concepto de área bajo una curva y admitimos la posi- 
bilidad de aproximarse a ella mediante sumas de rectángulos. Sin 
embargo, como se deducirá más adelante (pág. 473), un análisis más 
atento pondría de manifiesto que es deseable e incluso necesario para 
presentar de una manera lógica y completa la noción de integral de- 
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Fic, 262.—Subdivisión arbitraria en la definición general de integral. 


mostrar la existencia del límite para cualquier función continua f(x), 
sin referencia al concepto geométrico de área. 

4. Ejemplos de integración. Integración de x".—Hasta ahora, nues- 
tra discusión de la integral ha sido meramente teórica. La cuestión 
principal consiste en saber si formando una suma Sn y pasando al 
límite se Mega realmente a resultados tangibles en casos concretos. 
Naturalmente, esto requerirá algún razonamiento adicional adaptado 
a la función particular f(x) cuya integral se busca. Cuando Arquíme- 
des, hace 2000 años, encontró el área del segmento parabólico, realizó 
lo que actualmente llamamos la integración de la función f(x) = x?, 
mediante un procedimiento muy ingenioso; en el siglo xvir, los pre- 
cursores del cálculo integral moderno consiguieron resolver proble- 
mas de integración de funciones muy sencillas, tales como xn, también 
por medio de procedimientos especiales. Sólo después de adquirir 
mucha experiencia con numerosos casos “especiales se halló en los 
métodos sistemáticos del cálculo un procedimiento general de tra- 
tar el problema de la integración, con lo cual se amplió el campo de 
los problemas particulares solubles. En los párrafos siguientes discu- 
tiremos algunos problemas especialmente instructivos, que pertenecen 
a la etapa primitiva del cálculo, pues nada será más adecuado para 
aclarar el paso al límite, que constituye la esencia de la integración. 

a) Empecemos por un ejemplo casi trivial. Si y = f(x) es una 


b 
constante, p. ej., f(x) = 2, evidentemente la integral Í 2dx, interpre- 
a 


tada como un área, es igual a 2(b — a), puesto que el área de un rec- 
tángulo es igual a la base por la altura. Comparemos este resultado 
con la definición de integral como límite, según [6]. Si sustituímos 
en [5] /(x;) por 2 para todos los valores de j, encontraremos que 


s= Sa- Y 202 =2 Y Ar = 2(b — a) 


j=1 j=1 j=1 
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para todo n, puesto que 


D Ar = (21 — zo) + (za — a) + + (En — Fai) = Za — mo = b — a 
j=1 


b) Casi tan sencilla resulta la integración de f(x) = x. En este 


b 
caso, fas es el área de un trapecio (Fig. 263), y ésta, por geometría 
a 
elemental, vale 
b+a b2 — al 
OENE 





Este resultado se halla nuevamente de acuerdo con la definición [6] 
de la integral, como se ve efectuando el paso al límite sin recurrir a la 
figura geométrica. Si en [5] hacemos f(x) = x, la suma Sn se trans- 


forma en 3 a 
Sa -> xjAx -> (a + jôz)Ax 


3=1 j=1 
= (na + Ax + 2Ar + 34r + e + nAx)jAzx 
= nazr + (A+ 2 +3 +- +n) 


Utilizando la fórmula [1] de la página 19, que da la suma de la pro- 
gresión aritmética 1 + 2 + 3 + ... + n, obtenemos: 


1 
Sn = naÀz + mtd (Azy?. 


ba 





Por ser Ax = , ésta es igual a 


1 
Sa = a(b — a) + 4(6— a + 72 (0 — ay. 


Si ahora hacemos tender n a infinito, el último sumando tiende a 
cero, y se obtiene: 


d 
Km Sp = | x dx = a(b — a) + 1ab — ay =1/2b% — a?), 
va 


de acuerdo con la interpretación geométrica de la integral como área, 

c) Menos trivial resulta la integración de la función f(x) = 22. 
Arquímedes hizo uso de métodos geométricos para resolver el pro- 
blema equivalente de hallar el área de un segmento de la parábola 
y = 22, Nosotros vamos a proceder analiticamente, basándonos en la 
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y 
y bd) 
4,4) 
z 
os y” 0 b 
F1G. 263. — Área de un Fie, 264.— Área de un segmento 
trapecio. parabólico. 


definición [6a]. Para simplificar el cálculo formal elegimos 0 como 
«límite inferior» a de la integral; entonces Ar=b/n. Como xj=j + Ax 
y Hu) = ¡2(Ar)?, obtenemos para Sn la expresión 


Sa =D ADAz = [12+ (AB? + 22 + (A) e + eb > A 
j=1 
= (12 4+ 22 + -:- + n?) (An. 
Ahora podemos calcular efectivamente el límite; utilizando la 
fórmula 


nn + 1) Qn + 1) 
2 Sas Pao AN MA 
124 22 + +n 6 


establecida en la página 21, y haciendo la sustitución Ax = b/n, 
tenemos: 


n(n + 1)Qn +1) D b3 1 1 
Sa = 6 lr) (a+) 








Esta transformación preliminar facilita el paso al límite, puesto 
que 1/n tiende a cero al crecer n indefinidamente. Así, obtenemos 
3 b3 


b 
el limite F 1.-2= ES resulta, por tanto, 


b 
Í 22 dx = b3/3. 


0 


Aplicando este resultado al área desde 0 a a, tenemos: 


a 
f x? dx = a3/3, 
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y por sustracción: 





ETE a 
E 


Ejercicio: Demuéstrese de la misma manera, empleando la fórmula [5] de la 


página 22, que 
b bi — at 
xdr = 
í 4 


Utilizando la fórmula general que expresa la suma 1* -+ 2x + +++ -+ nk de las 
potencias k-ésimas de todos los números naturales desde 1 hasta n, se puede ob- 
tener el resultado 





d pk+1 — ak+1 
il xk dr = ESTE E siendo k un entero positivo arbitrario. [7] 
1] 

*En lugar de proceder de esta manera, podemos obtener de forma más sen- 
cilla un resultado aún más general utilizando nuestra observación anterior res- 
pecto a la posibilidad de calcular la integral mediante una subdivisión del inter- 
valo por puntos no equidistantes. Estableceremos la fórmula [7] no sólo para 
cualquier entero positivo k, sino para un número racional arbitrario, positivo 
o negativo, 

k = ufo, 


donde u es un entero positivo y v otro entero, positivo o negativo. Se excluirá 
únicamente el valor k = —1, para el cual la fórmula [7] carece de significado. 
Supondremos, además, que 0 < a < b. 

Para obtener la fórmula integral [7] formamos Sn eligiendo los puntos de sub- 
división To = Q, %1, X3,* * *, £n = b en progresión geométrica. Pongamos V bja = q, 
por lo que b/a = q”, y definamos Xo = a, zı = 0q, T3 = 0q3,-**, In = QQ? = b. 
Mediante este artificio, el paso al límite se hace muy sencillo. Para la «suma rec- 
tangular» Sy encontramos: 


Sn = ak(aq — a) + akgK(aq? — aq) + argik(ag3 — aq?) + 
+ ee + arxgia-Dk(agn — aqu=l), 


puesto que f(x;) = x,k = argix y Ax, = Xj41 — zj = aqi+1 — agil, 
Como cada término contiene el factor ar(ag — a), podemos escribir: 


Sa = ax+kg — 1) { 1 + g+ 4 gee y... + go- y, 


Sustituyendo qx+1 por £ vemos que la expresión entre corchetes es una pro- 
gresión geométrica, 1 + t + £8 + -»- + fm-1, cuya suma, como se demostró en la 


; k+l pr 
página 21, es (tR— 1)/(ft—1). Pero tn = quik+n = (+) =s 
En consecuencia, a a 

bk+1 — gk+1 


pX+1 — gk+1 
Sn = (q — 1) GATT 


== 8 
m 18 








donde 
q+ — 1 


q=—i 
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Hasta aquí n ha permanecido constante. Hagamos crecer n y determinemos 


el límite de N. Al aumentar n, la raíz n-ésima Voja = q tenderá a 1 (pág. 334), 
por lo que tanto el numerador como el denominador de N tenderán a cero, lo 
que impone cierta cautela. Supongamos primero que k es un entero positivo; 
podrá efectuarse entonces la división por q — 1, obteniendo (pág. 21) N = qk + 
+q! + --+ +q + 1. Si ahora n aumenta, q tiende a 1, o sea, que q2, q3-* +, qE 


tenderán también a 1, por lo que N tiende a k 4- 1. Pero esto nos dice que Sp 
px+l — gk+1 


tiende A? según queríamos demostrar. 


Ejercicio: Demuéstrese para cualquier número racional k 4 —1 que el límite 
es el mismo; es decir, que N > k + 1 y que, en consecuencia, el resultado [7] 
continúa siendo válido. Siguiendo los mismos pasos, demuéstrese primero para 
números enteros negativos k. Después, si k = ujv, escríbase q1/V = s, resultando: 


s(k+l}v — 1 su+vo 1 suty —1 sv—íÍ 





TAE: pe aad 
Si n aumenta, tanto s como q tienden a 1, por lo que los dos cocientes del 


segundo miembro tienden a u + v y v, respectivamente, lo que proporciona nue- 


u+vu 
= k + í como límite de N. 





vamente 


Más adelante veremos cómo los métodos más simples y potentes del cálculo 
reemplazan esta discusión un tanto larga y artificiosa. 


Ejercicios: 1 1 
1. Verifíquese la integración precedente de xX para los casos k = ——, — -ys 
2, —2,3, 8, a eag 


2. Calcúlese el valor de las siguientes integrales: 


-1 +1 2 -2 n 
.a) | adx; b) Í xdr; c) ll x? dx; al x? dx; e) Í x dx 
y -2 -1 1 -1 o 


3. Determínese el valor de las siguientes integrales: 


+1 2 +1 +1 
a) Í addx; b) f x3 cos x dx; c) f xt cos? z sen z dx; af tg x dx. 
2 


-1 = -1 -1 

(Indicación: Considérese la gráfica de cada una de las funciones bajo el signo 
integral; téngase en cuenta su simetría con respecto a x = 0, e interprétense las 
integrales como áreas.) 

*4. Intégrese sen x y cos z desde 0 hasta b, haciendo Ax = h y utilizando las 
fórmulas dadas en la página 498. 

5. Intégrese f(x) = x y f(x) = x? desde 0 hasta b, dividiendo el intervalo en 
partes iguales y utilizando en [6a] los valores v; = 1/a(%; + £j+1). 

*6. Utilizando el resultado [7] y la definición de integral con valores iguales 
de Ax, demuéstrese para n-> oo la relación límite: 


1k p 2% 4 ++ q pk 1 
nx+1 "+ 





q Para n > oo. 


$ 


1 
(Hágase de Ax y demuéstrese que el límite es igual af xX dx.) 
0 
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7. Demuéstrese, para n —> oo, que 








1 1 1 1 e 
——l === + == + **: ——— XV? — 1). 
zlty +=)" ) 


(Escríbase esta suma de tal modo que el límite aparezca como una integral.) 

8. Calcúlese el área del segmento parabólico limitado por un arco P Ps y la 
cuerda correspondiente de una parábola y = ax? en función de las abscisas zı y 
za de los dos puntos. 


5. Reglas del «cálculo integral». —Un paso importante en el des- 
arrollo del cálculo consistió en formular ciertas reglas generales me- 
diante las cuales podían reducirse problemas complicados a otros más 
sencillos, con lo que la solución aparecía de una manera casi me- 
cánica. Este carácter algorítmico se pone especialmente de mani- 
fiesto con la notación de Leibniz. Sin embargo, una atención excesiva 
a la parte puramente mecánica de la resolución de los problemas 
puede degradar la enseñanza del cálculo hasta convertirla en una 
disciplina vacía. 

De la definición [6] o de la interpretación geométrica de la integral 
como área se deducen inmediatamente algunas reglas sencillas de 
integración. 

La integral de la suma de dos funciones es igual a la suma de las 
integrales de las dos funciones. La integral del producto de una cons- 
tante c por una función f(x) es igual a c por la integral de f(x). La fór- 
mula siguiente combina ambas reglas: 


b b b 
f [cf(x) + dg(x)] dz = ef f(z) dz + af g(x) dx. 19] 
a a a 

La demostración es consecuencia inmediata de la definición de 
integral como limite de la suma finita [5], puesto que la fórmula co- 
rrespondiente para una suma S, es evidentemente cierta. La regla se 
extiende en seguida a sumas de más de dos funciones. 

Como ejemplo del uso de la misma consideremos un polinomio, 


f(z) = ao + az + ast? + +++ + apa, 


cuyos coeficientes ao, 41, 42, ..., Ap son constantes. Para formar la 
integral de f(x) desde a hasta b, procederemos término a término, de 
acuerdo con la regla. 

Utilizando la fórmula [7], encontramos: 


À: b3 — aè bati — ga+l 
foda- ata 2 +... Hasar 
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Otra regla análoga, consecuencia evidente tanto de la definición 
analítica como de la interpretación geométrica de la integral, es la 


siguiente: 
b e e 
i [(2) de + f [(a) de = Í Í(x) de. [10] 
a b a 


Además es evidente que la integral es igual a cero si a es igual a b. 
La regla de la página 415, 


b a 
|l f(x) de = -Í f(x) dx, [11] 
a b 


está de acuerdo con las dos últimas enunciadas aquí, puesto que co- 
rresponde a [10] para c = a. 

A veces conviene utilizar el hecho de la independencia de la inte- 
gral respecto de la letra elegida para designar la variable; p. ej., 


b b b 
Í f(x) dx -f f(u) du -f 1(6) dt, ete., 


ya que un simple cambio en el nombre de las coordenadas del sis- 
tema al cual se refiere la gráfica de la función no altera el área bajo 

la curva. La misma observación 
y'= vale si introducimos ciertos cam- 
bios en el propio sistema de coor- 
denadas; p. ej., si trasladamos el 
origen hacia la derecha en una 
unidad, de O a O’, como en la 
figura 265, con lo cual x queda 
reemplazada por una nueva absci- 
sa x’ tal que =1+x%. Una 
curva de ecuación y = f(x) tendrá 
en el nuevo sistema de coordena- 
i das la ecuación y=((1+x'). [Por 
to AS +a) ejemplo, y =1/x =1/(1 + x')]. Si 
el área A dada bajo esta curva 
estaba limitada por z = 1 y x=b, 
en el nuevo sistema de coordenadas quedará limitada por x’ =0 y 
x' = b — 1. Así se tiene: 


b b-1 
Í {(£) de -Í ia + r’) dr, 
1 0 


4 
l 
l 
l 
l 
1 
| 





FiG. 265. — Traslación del eje y. 


SEC. 1] LA INTEGRAL 423 





o bien, cambiando q’ por u, 


d b-1 
Í f(x) dx = Í 11 + u) du; {12} 
1 


0 


b 1 b-1 1 
J+ dx -f Toues [12a] 


y para la función f(x) = xk, 


por ejemplo, 


“b d-1 
] xx dx -f (1 + u)* du. [12b] 


1 0 


Análogamente, 


b d-1 
f ak dx -f (Q +ukdu (k>0). [12c] 


0 -1 


Puesto que el primer miembro de [12c)] es igual a bx+1/(k + 1), 
tendremos: 





b-1 px+1 
f (1 + u) du = [12å] 
-1 


Ejercicios: 
1. Calcúlese la integral del 1 + xz + r? + --* + z? desde O hasta b. 
2. Demuéstrese que para n >0 la integral de (1 + x)2% desde —1 hasta z 
es igual a 
(1 + 2)4 
(+1) 
3. Demuéstrese que la integral desde 0 hasta 1 de xn sen r es menor que 
1/(n + 1). (Este último valor es el de.la integral de 12.) 
4. Demuéstrese directamente y utilizando el teorema del binomio, que la 
integral desde —1 a z de (1 + 2)2/n, es (1 + z)2+1/n (n + 1). 


Finalmente, mencionaremos dos reglas importantes que aparecen 
en forma de desigualdades y que permiten estimar de forma poco 
aproximada, pero útil, el valor de muchas integrales. 

Supongamos > > a y que lòs valores de f(x) en el intervalo no 
sobrepasan a los de otra función g(x). Entonces se tiene: 


» d 
f 1(x<) dz <Í g(x) dz, [13] 
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como se deduce inmediatamente de la figura 266 o de la definición 

analítica de integral. En particular, si g(x) = M es una constante no 

$ excedida en ningún punto por los va- 
lores de f(x), tendremos: 


b b 
gim fsoe-fne=x00-0 
a a 
S (2) .Por consiguiente, 
o i A 
i j f f(x) dx < M (b — a). [14] 
FıG, 266. — Comparación a 


de integrales. 
Si f(x) es no negativa, será f(x) = 
= | f(x) |. Si (2) < 0, será | f(x) | > f(2); de donde resulta, ponien- 
do g(z) = | /(2) | en [13], que 


b b 
f H(x) dx <Í LI) | dz. [15] 


Puesto que | — f(x) | = | f(x) |, se deduce también que 


b b 
-f HKx) de <Í | {(£) | dx, 


fórmula que, junto con [15], proporciona la desigualdad 


b 
f [(x) de 


TI. LA DERIVADA 








b . 
< f | f(x) | dz. . 116] 


1. La derivada como pendiente.-—Mientras que el concepto de in- 
tegral tiene sus raíces en la antigüedad clásica, la otra idea funda- 
mental del cálculo, la derivada, no se formuló hasta el siglo xvir por 
Fermat y otros. Fué el descubrimiento, efectuado por Newton y 
Leibniz, de la relación orgánica entre estas dos ideas, aparentemente 
tan dispares, lo que inició el inigualado desarrollo de la ciencia ma- 
temática. 

Fermat estaba interesado por el problema de encontrar los máxi- 
mos y mínimos de una función y = f(x). En la gráfica, un máximo 
corresponde a una cúspide, más alta que todos los demás puntos pró- 
ximos, mientras un mínimo corresponde al fondo de un valle situado 
por debajo de todos los puntos inmediatos. En la figura 191 el punto B 
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es un máximo, y el C, un mínimo. Para caracterizar los puntos máxi- 
mos o mínimos es natural utilizar el concepto de tangente a una curva. 
Supongamos que la gráfica no tiene puntos angulosos u otras singu- 
laridades, y que en todo punto posee una dirección definida, dada 
por una recta tangente. En los puntos de máximo o mínimo, la tan- 
gente a la gráfica de la curva y = f(x) debe ser paralela al eje de las x, 
puesto que, de lo contrario, la curva ascendería o descendería en dichos 
puntos. Esta observación nos sugiere la idea de considerar con toda 
generalidad, en cualquier punto, P, de la gráfica y = f(x), la dirección 
de la tangente a la curva. 

Para determinar la dirección de una recta en el plano (x, y), es cos- 
tumbre dar su pendiente, que es la tangente trigonométrica del ángulo 
de la dirección del semieje positivo de las x con la recta. Si P es un 


y y 





p 


-----R 





i 
I 
1 
+ 
t 
, 
J 


la-eta R 


1 
i 
t 
H 
' 
4 
Q 





F1G. 267. — Pendientes de rectas. 


punto cualquiera de la recta L, nos dirigimos hacia la derecha hasta un 
punto, R, y después hacia arriba o hacia abajo hasta otro punto, Q, de 
la recta; por ello, la pendiente de L será tg « = RQ/PR. La longitud 
PR se toma en sentido positivo, mientras que se considera que RQ 
es positiva o negativa, según haya que subir o bajar para pasar de 
R a Q, por lo que la pendiente da la subida o el descenso por unidad 
de longitud a lo largo de la horizontal cuando nos desplazamos sobre 

_la recta de izquierda a derecha. En la figura 267, la pendiente de la 
primera recta es ?/3, y la de la segunda —1. 

Por pendiente de una curva en un punto P, entendemos la pen- 
diente de la tangente a la curva en P. Mientras aceptemos la tangente 
a una curva como un concepto matemático dado intuitivamente, el 
único problema que se plantea es el de hallar un procedimiento para 
calcular la pendiente. Por el momento aceptaremos este punto de 
vista, dejando para más adelante (véase suplemento a este capítulo) 
un análisis más profundo del problema -en cuestión. 
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2. La derivada como límite.—La pendiente de una curva y=f(x) 
en el punto P(x, y) no puede calcularse con referencia exclusiva a la 
curva en el punto P, sino que tenemos que recurrir a un paso al li- 
mite, bastante análogo al utilizado para calcular el área bajo una 
curva, y este paso al límite constituye la base del cálculo diferencial. 
Consideremos en lá curva otro punto, Py, próximo al P, de coordena- 
das 21, yı. Llamaremos 4 a la recta que une P con P}; es una secante 
de la curva que se aproxima a la tangente a la curva en P cuando P3 
está muy próximo a P. Designaremos por a el ángulo que forma h 
con el eje de las x. Si hacemos tender ahora x, a x, Pı se moverá a lo 
largo de la curva hacia P, y la secante t, tenderá, como posición lí- 


Y 





FiG. 268. —La derivada como límite. 


mite, a la tangente t en el punto P de la curva. Si se designa por «a el 
ángulo que forma t con el eje de las x, al tender xı hacia x *, resulta 


Yi —>Y, P> P, tt, y ai> a. 


La tangente es el limite de la secante, y la pendiente de la tangente 
es el limite de la pendiente de la secante. 

Aunque no tenemos una expresión explícita de la pendiente de la 
propia tangente t, sabemos que la pendiente de la secante t, está 
dada por la fórmula 


— xı) — f(x 
pendiente de t, = a y = Ken 1e) 
12 x= U 





* La notación empleada aquí es ligeramente distinta de la utilizada en el capítulo VI, 
pues allí considerábamos fijo xı en x—>w.. No debe haber ninguna confusión por razón 
de esta permutación de símbolos. 
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o bien, si designamos nuevamente la operación de formar una dife- 
rencia mediante el símbolo A, 
Ay _ Af(z) 


pendiente de tı = Ae Aa 





La pendiente de la secante tı es un «cociente de diferencias», o sea, 
la diferencia Ay de los valores de la función dividida por la diferencia 
Ax de los valores de la variable independiente. Además, pend. de t= 
Ie) -ie _, A 

Yi xt SS 


= lím de la pend. de 4 = lim lím Tr’ donde los limi- 


tes se toman suponiendo que xı > x; es decir, que Ar = 1, — x —> 0. 

La pendiente de la tangente t a la curva es el limite del cociente de 
diferencias Ay/Ax cuando Ax = x, — x tiende a cero. 

La función dada f(x) proporciona la altura de la curva y = f(x) 
para el valor x. Podemos considerar ahora la pendiente de la curva en 
un punto variable, P, de coordenadas x, y [=f(x)], como una nueva 
función de x, que representaremos por f'(x) y llamaremos derivada de 
la función f(x). Se llama derivación de f(x) al paso al límite mediante el 
cual se la ha obtenido. Este proceso es una operación que asocia a una 
función dada f(x), otra función f'(x), de acuerdo con una regla defi- 
nida, exactamente igual que la función f(x) viene definida por una 
regla que atribuye a un valor cualquiera de la variable x el valor f(x): 


f(x) = altura de la curva y = f(x) en el punto z; 
f'(£) = pendiente de la curva y = f(x) en el punto zx. 


La derivada f'(x) es, pues, el límite del cociente de la diferencia 
Ha) — f(x) por la diferencia zı — z: 


f(x) = lím o a cuando xı > T. (1] 


Otra notación, a menudo útil, es: 
f(x) = Dix), 


donde la D es una simple abreviatura de «derivada de». Todavía 
otra notación distinta es la empleada por Leibniz para designar la 
derivada de y = f(x): 

a, I 

dz dx ” 
que estudiaremos más adelante, y que indica el carácter de la derivada 
como límite del cociente de diferencias o incrementos -Ay/Azx o Af(x)/Ar. 
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Si recorremos la curva y = f(x) en la dirección que corresponde a 
valores crecientes de x, la derivada positiva, f'(x) > 0, en un punto 
significa que la curva se eleva (el valor de y aumenta), y al contrario, 

una derivada negativa, 

f(x) <0, quiere decir 

que la curva desciende, 

mientras que f(x) =0 
significa que para ese 
valor de x la curva tiene 
una dirección horizontal. 
a En un máximo o míni- 
mo, la pendiente debe ser 

igual a cero (Fig. 269). 

Fic. 269, — Signo de la derivada. De ahí que resolvien- 

do la ecuación f'(x) =0 

respecto de x, se puede determinar la posición de los máximos y mí- 
nimos, como lo hizo Fermat por primera vez. 

3. Ejemplos.-—Podría parecer que las observaciones que nos con- 
dujeron a la definición [1] carecen de valor práctico. Se ha reempla- 
zado un problema por otro; en lugar de preguntar cuál es la pendiente 
de la tangente a una curva y = f(x) en un punto, se pregunta por el 
valor de un límite [1], lo que, a primera vista, parece igualmente difícil. 
Pero en cuanto abandonamos el dominio de las generalidades y consi- 
deramos funciones particulares f(x) obtenemos resultados tangibles. 

La función más sencilla es f(x) = c, donde c es una constante. La 
gráfica de la función y = f(x) = c es una recta horizontal que coincide 
con todas sus tangentes, y es evidente que f'(x) = 0 para todos los 
valores de x. Esto se deduce también de la definición [1], pues 






S(z)=0 


Ay E Ha) ~ f(x) ce 0 


=0, 
Ar 12 A E r 








por lo que resulta trivial que 


=0Q cuando 21> 2. 


Hr) — f(x) 
RES 


1 


lí 


Como segundo caso consideraremos la función y = f(x) = z, cuya 
gráfica es una recta que pasa por el origen y es bisectriz del primer 
cuadrante. Geométricamente es obvio que 


f(x) =1 
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para todos los valores de x, y la definición analítica [1] proporciona 
también el mismo resultado: 


(60 fa) n-ae 





=1, 


IL LL 
de modo que 
fr) — Ha) 
lim ———— =1 para q> zx. 
Y] — Y 


El ejemplo más sencillo. y ya no trivial nos lo proporciona la deri- 
vación de la función 


y =(()=2%, 


lo que equivale a encontrar la pendiente de una parábola. Este es el 

caso más simple que nos enseña cómo se ha de efectuar el paso al 

límite cuando el resultado no es evidente de antemano. Tenemos: 
Ay _ a)-e) rie 


Az tn- ha 





Si intentáramos efectuar directamente el paso al límite en nume- 
rador y denominador, obtendríamos la expresión carente de significa- 
do 0/0. Pero podemos evitar este escollo eliminando antes de pasar al 
límite el factor perturbador zı — x. (Al calcular el límite del cociente 
de diferencias, consideramos exclusivamente valores xy zx, por lo 
que está permitido efectuar esa simplificación; véase pág. 318). Así 
obtenemos la expresión: 


xa — a (21 — 2) (21 +12) 
t-r Y] —Y 


= zı + T. 


Después de la simplificación, no existe ninguna otra dificultad con 
el límite, cuando xı > x. Este se obtiene «por sustitución», pues en 
la nueva forma, 11 + x, el cociente de diferencias es función continua, 
y el límite de una función continua para tı >x es simplemente el 
valor de la función para zı = q; o sea, en nuestro caso, t + 7 = 2x, 
por lo que 

f f(x) = 2x para f(x) = z. 


De manera análoga, podemos demostrar que para f(x) = 
f'(x) = 3x2, pues el cociente de diferencias 


Ay _ 16016) _ 
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puede simplificarse teniendo en cuenta la fórmula xi — 13=(21—2) 
(17 + xix + 22), eliminándose el denominador Arx = qı — x, con lo 
que se obtiene la expresión continua 


Ay 2 
Tx = 2 + gr + arè, 


Si ahora se hace tender qı a x, esta expresión tiende a 124-12+x22, 
de donde resulta f'(x) = 3x2. 


En general, para f(x) = xn, siendo n un número entero y positivo 
cualquiera, se obtiene la derivada 


f(x) = nan, 
Ejercicio: Demuéstrese el resultado anterior. [Utilicese la fórmula algebraica 
oa (a — x) (ap radar ata o a Y n—1),] 
Como un ejemplo más de los sencillos artificios que permiten deter- 
minar explícitamente la derivada, consideremos la función 
1 
= f(x) = — 
NE 


Tenemos: 


Ay yi—y 1 1 1 xz — 2 1 
Ax zı — x zı x 








1-2 Tit Tı — T 


Después de simplificar, resulta Ay/Ax = —1/xıx, que es continua 
para xı = x, por lo que en el límite 


1 
PA 


Naturalmente, ni la derivada ni la propia función están definidas 
para x = 0. 


1 2 
Ejercicios: Demuéstrese en forma análoga que para f(x) = PA f(x) = — Po 
1 n 
para f(x) = Ta f(x) = — 1 + Para Ka) = (1 + 239, (2) = n (1 4 ajo, 


Vamos a efectuar la derivación de 


y =((1) = Vx 
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El cociente de diferencias en este caso es: 


n-y Va- vz 


t-r Toa 


Mediante la fórmula qı — x = (y — V2) (Vu + yz), pode- 
mos eliminar un factor y obtener la expresión continua: 


Pasando al límite se tiene: 


1 
Ma) = 7 
2V1 
Ejercicios: Demuéstrese que para 


f(x) = Ta Vx) = i para f(x) = Vz, f(x) = yz para 


Kz) = V1 — 22, f(x) = 





para f(x) = Vx, f2) = Ta = 


-r 
VIa 

4. Derivadas de las funciones trigonométricas.—Trataremos ahora 
una cuestión muy importante: la derivación de las funciones trigonomé- 
tricas, para lo cual utilizaremos exclusivamente la medida de los 
ángulos en radianes. 

Para derivar la función y = /(x) = sen x, ponemos 1, — T = h, 
con lo que resulta 1, = x + h y f(xı) = sen zı = sen (x + h). Median- 
tė la fórmula trigonométrica para sen (A + B), resulta: 


f(xı) = sen (x + h) = sen x cos h + cos x sen h. 


h cos h — 1 
) + sen A ) [2] 


.Si hacemos tender ahora 1, a x, h tiende a 0, sen ha 0 y cos ha 1. 
Además, de acuerdo con los resultados de la página 319, se tiene: 


De donde, 





K2) — f(z) sen (z+ h) — sen z (5 
AAA AA OS 
x-—z h 


ii sen h 4 ii cosh — 1 ü 
m poor y m N. 





Por tanto, el primer miembro de [2] tiende a cos x, de donde resulta: 
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La derivada de la función f(x) = sen x-es f'(x) = cos x, o más 
brevemente: 
D sen x = cos x. 


Ejercicio: Demuéstrese que D cos x = —sen zx. 


Para derivar f(x) = tg x, escribiremos tg x = sen x/cos x, con lo 
que resulta: 


He +h) — fa) (E (£ + h) maz) 1 





h cos (x +h) cosg h 
sen (x + h) cos x — cos (x + h) sen x 1 
h cos (x + h) cos x 
sen h 1 





h cos(x + h) cosx 


[La última igualdad se deduce de la fórmula sen (A — B) = 
= sen A cos B — cos A sen B, para A =x + h y B = h.] Si hace- 
mos tender ahora h a cero, sen h/h tiende a 1, cos (x + h) tiende a 
cos z, y deducimos: l 

La derivada de la función f(x) = tg x es f'(x) = 1/cos?x, o sea, 


Dt = —— 
es cos? x 


Ejercicio: Demuéstrese que D cot x = —1/sen? x, 


*5. Derivación y continuidad.—Vamos a demostrar que toda fun- 
ción derivable es continua. En efecto, si existe el límite de Ay/Ax al 
tender Ax a cero, es fácil ver que la diferencia Ay de la función f(x) 
llega a ser tan pequeña como se desee al tender a cero la diferencia Az. 
De ahí que siempre que pueda derivarse una función, su continuidad 
está automáticamente asegurada; por consiguiente prescindiremos de 
mencionar explícitamente o de demostrar la continuidad de las fun- 
ciones derivables que aparezcan en este capítulo, a no ser que exista 
una razón particular para ello. . 

6. Derivada y velocidad. Segunda derivada y aceleración.—En lo 
que precede se ha estudiado la derivada desde el punto de vista geo- 
métrico de la gráfica de la función. Pero el significado del concepto 
de derivada no se limita al problema de hallar la pendiente de la 
tangente a una curva. En las ciencias naturales importa mucho más 
determinar la variación relativa de cierta magnitud f(f) que varía con 
el tiempo t£. Fué en esta dirección por la cual llegó Newton al cálculo 
diferencial. Deseaba, en particular, analizar el fenómeno de la veloci- 
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dad, considerando el tiempo y la posición de una partícula en movi- 
miento como variables, o, como decía Newton, «cantidades fluyentes»., 

Si una partícula se mueve siguiendo una trayectoria rectilínea, su 
movimiento está completamente descrito dando la posición x para un 
tiempo cualquiera ¿ como una función x = f(t). Se define un «movi- 
miento uniforme» de velocidad constante b a lo largo del eje x me- 
diante una función lineal x = a + bt, donde a es la abscisa de la 
partícula en el tiempo t = 0. 

En el plano, el movimiento de una partícula queda descrito por 
dos funciones: 

z = (0, y = g(t), 
que determinan las coordenadas en función del tiempo. En particu- 
lar, un movimiento uniforme corresponde a un par de funciones 
lineales 
x= a + bt, y =c + dt, 

donde b y d son las dos «componentes» de la velocidad constante, 
y a y c, las coordenadas de la partícula en el instante f = 0; la tra- 
yectoria de la partícula es una recta, de ecuación 


(z — ad — (y — c) b = 0, 


que se obtiene por eliminación de f entre las dos ecuaciones anteriores. 

Si una particula se mueve en el plano vertical z, y, exclusivamente 
sometida a la acción de la gravedad, según se demuestra en física 
elemental, su movimiento está determinado por las dos ecuaciones 
siguientes: 

x= a+ bt, y = c + di — tagt, 

donde. a, b, c, d, son constantes que dependen del estado inicial de la 
partícula, y g la aceleración debida a la gravedad (aproximadamente 
igual e 9,90 mjseg? si la distancia se mide en metros y el tíempo en 
segundos). La trayectoria de la partícula, obtenida eliminando t entre 
ambas ecuaciones, es una parábola 
(x — ay 

p> 
si b 4 0; en otro caso es un segmento del eje vertical. 

Si una partícula se mueve a lo largo de una curva del plano (como 
un tren sobre la vía), su movimiento puede describirse dando la lon- 
gitud del arco s, medido a partir de un punto inicial, Po, hasta la po- 
sición P de la partícula en el instante t, como función de t: s = [(t); 
p. ej., en el círculo unidad z? + y? = 1, la función.s = cf describe una 
rotación uniforme de velocidad c, a lo largo de la circunferencia. 





d 
y =c += (24) — 1/99 
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Ejercicios: *Dibújense las trayectorias de los movimientos planos déscritos por: 

1. x = sent, y = cost. 

2. x= sen 2f, y = sen 3t. 

3. x = sen 2t, y = 2 sen 3t. 

4. En el movimiento parabólico descrito anteriormente, supongamos que la 
partícula se encuentra en el origen. para t = 0 y b > 0, d > 0, Hállense las corde- 
nadas del punto .más alto de la trayectoria. Determínerse el tiempo, t, y el valor 
de x para.la segunda intersección de la trayectoria con el eje de las x. 


El propósito principal de Newton fué el de determinar la veloci- 
dad en an movimiento no uniforme. Para mayor sencillez, conside- 
remos el movimiento de una partícula sobre una recta, definido por 
la función x = f(t). Si el movimiento fuera uniforme, con velocidad 
constante, podría hallarse la velocidad tomando dos valores £ y t; del 
tiempo y los correspondientes valores x = f(t) y xı = [(t1), y formando 
el cociente: 

distancia xı— q f) — 10 
tiempo tit ti—t 








v = velocidad 





Así, p. ej., si t se mide en horas y x en kilómetros, para t¿—i=1, 
zı — x será el número de kilómetros recorridos en una hora, y v será 
la velocidad en kilómetros por hora. Decir que la velocidad del móvil 
es constante equivale simplemente a que el cociente de diferencias 


Kt) — 10 ; 
EFENA [3] 
es el mismo para todos los valores de t y ty: Pero cuando el.movimiento 
no es uniforme, como ocurre en el caso de un grave, cuya velocidad 
aumenta con el tiempo, el cociente [3] no da la velocidad en el ins- 
tante t, sino la velocidad media durante el intervalo de tiempo de t a h. 
Para obtener la velocidad. en el instante preciso t, debemos hallar el 
límite de la velocidad media cuando f tiende a t. Así, definiremios 
con Newton: 


ty — {t 
velocidad en el instante ł = lím Hen = FO = Ft). 14] 
r= 


En otras palabras, la velocidad es la derivada de la distancia respecto 
al tiempo o «la variación instantánea» de la distancia respecto al tiem- 
po (lo que es distinto de la variación media definida por [3]). 

Se llama aceleración a la variación unitaria de la velocidad. Es sim- 
plemente la derivada de la derivada, que se representa generalmente 
por f''(t) y se llama segunda derivada de [(t). 
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Galileo observó que para un cuerpo que cae libremente, la distan- 
cia vertical que recorre durante el tiempo t está dada por la fórmula 


x = [(1) = tagt, [5] 


donde g es la constante de gravitación. Derivando [5], se deduce que 
la velocidad, v, del cuerpo en el instante, f, está dada por 


v = (0) = gl, [6] 
y la aceleración, «a, por 
a = f" =9, 
que es constánte. 
Supongamos que se desea calcular la velocidad del cuerpo, 2 se- 
gundos después de iniciar su caída. La velocidad media durante el 
intervalo de tiempo de t = 2 a ł = 2,1 es: 


YO" — 1YYag(2)? 


212 = 20,09 (metros por segundo), 


Sustituyendo t = 2 en [6], encontramos la velocidad instantánea al 
final de los dos segundos, que es v = 19,6, 

Ejercicio: ¿Cuál es la velocidad media del cuerpo. durante el intervalo de tiem- 
po de t = 2 a £ = 2,01, y de t = 2 a t = 2,001? 

En el caso de un movimiento plano, las dos derivadas f'(t) y g'(t) 
de las funciones x = f(t), y = g(t) definen las componentes de la velo- 
cidad. Para el movimiento a lo largo de una curva dada, la velocidad 
estará definida por la derivada de la función s = f(f), donde s es la 
longitud del arco. 

7. Significado geométrico de la segunda derivada.—La segunda 
derivada es también importante en geometría y análisis, puesto. que 
f'"(x) expresa la variación unitaria de la pendiente f'(x) de- la curva 
y = f(x), por lo que sirve de indicación de cómo se modifica la forma 
de la curva. Si f(x) es positiva en un intervalo, entonces la varia- 
ción relativa de f'(x) es positiva, lo que significa que la función crece 
al aumentar x. En consecuencia, f”(x) > 0 significa que la pendiente 
f'(x) aumenta al crecer x, por lo que la curva se acerca más a la ver- 
tical cuando la pendiente es positiva, y se separa de ella cuando es 
negativa. Decimos entonces que la curva tiene su concavidad dirigida 
hacia arriba (Fig. 270). 

Análogamente, si f(x) < 0, la curva y =: f(x) tiene su concavidad 
dirigida hacia abajo. (Fig. 271). 

La parábola y = f(x) = x? tiene su concavidad dirigida constan- 
temente hacia arriba, puesto que f”(x) = 2 es siempre positiva. La 
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curva y = f(x) = 13 tiene su concavidad dirigida hacia arriba para 
x > 0, y hacia abajo para x < 0 (Fig. 153), pues f'(x) = 6x, como el 
lector puede comprobar fácilmente. Para x = 0, se tiene f'(x) = 3x2=0 


r y 
fiz<0 
Ff"()>0 


Fic. 270. Fic. 271. 


(sin máximo ni mínimo); también f'(x) = 0 para x = 0. Este punto 
se denomina punto de inflexión. En tales puntos, la tangente (en este 
caso el eje x) atraviesa la curva. 

Si s representa la longitud del arco y «a el ángulo de pendiente, 
a = h(s) será una función de s, que variará al recorrer la curva. La 
derivada h'(s) se llama curvatura de la curva en el punto donde el arco 
tiene longitud s. Sin detenernos a dar la correspondiente demostración, 
recordaremos que la curvatura x puede expresarse mediante la primera 
y la segunda derivadas de la función y = f(x) que define la curva: 


x = fæ) / 1 + (5) 92. 


8. Máximos y mínimos.—Podemos determinar los máximos y mí- 
nimos de una función dada f(x), calculando la primera derivada f'(x); 
hallando los valores que la anulan, e investigando, finalmente, cuáles 
de ellos-corresponden a máximos o a mínimos. Puede decidirse esta 
última cuestión formando la segunda derivada f''(x), cuyo signo nos 
dice si la curva es cóncava o convexa, y cuya anulación indica en 
general la existencia de un punto de inflexión en el cual no existe 
extremo. Mediante los signos de f'(x) y f''(x) podemos determinar no 
sólo los extremos, sino la forma de la gráfica de la función. Este mé- 
todo nos da los valores de x para los cuales hay máximo o mínimo; 
los valores correspondientes de y = f(x) se tendrán sustituyendo estos 
valores de x en f(x). 

Como ejemplo, consideraremos el polinomio 


Ka) = 223 — 912 + 122 + 1, 
para el cual se tiene: 


FG) = 6x2 ~ 182 +12, f£) = 12x — 18, 


SEC. 111] TÉCNICA DE LA DERIVACIÓN 437 


Las raíces de la ecuación de segundo grado f'(x) = 0 son vı = 1 y 
z2 = 2; y tenemos: f'(x1) = —6 < 0, f”(x2) = 6 > 0. Por tanto, la 
función f(x) tiene un máximo f(x1) = 6 y un mínimo [(x2) = 5. 

Ejercicios: 

1. Trácese la gráfica de la función anterior. 

2. Discútase y trácese la gráfica de f(x) = (x? — 1) (2? — 4). 

3. Determínese el mínimo de x + 1/x; de x + a?/x; de px + q/x, siendo p y q 
positivos. ¿Tienen máximos estas funciones? 

4. Determínense los máximos y mínimos de sen x y sen (x?). 


II, TÉCNICA DE LA DERIVACIÓN 


Hasta ahora nuestros esfuerzos se han dirigido a derivar diversas 
funciones transformando adecuadamente el cociente de incrementos 
antes de realizar el paso al límite. Se dió un paso decisivo cuando, 
debido a las investigaciones de Newton y Leibniz y sus sucesores, se 
reemplazaron esos procedimientos particulares por métodos generales 
más potentes. Mediante ellos, se puede derivar casi automáticamente 
cualquier función de las que normalmente aparecen en matemáticas, 
una vez dominadas unas pocas reglas muy sencillas y aprendido a 
reconocer su aplicabilidad. Así, la derivación ha adquirido el carácter 
de un «algoritmo» de cálculo, y es este aspecto de la teoría el que se 
expresa mediante la palabra «cálculo». 

No podemos dar muchos detalles de esta técnica, y sólo menciona- 
remos unas cuantas reglas. 

a) Derivación de una suma. Si a y b son constantes y se define la 
función k(x) por 

k(x) = af(x) + bala), 
se tiene, como el lector puede verificar fácilmente, 
K(x) = afí(x) + bg (e). 


Una regla análoga es válida para cualquier número de términos. 
b) Derivación de un producto. Para un producto 


p(a) = [(ag(x), 
la derivada es: 
px) = f(x)g'(x) + gfx). 


Esto se demuestra fácilmente mediante el siguiente artificio, que con- 
siste en sumar y restar un mismo término: 


piz + h) — pla) = f(x + haz + h) — (Dax) = 
= Ha + ga + h) — f(z + haa) + Ha + ge) — Kaga) 
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de aquí se obtiene: 


p(z + h) — p(x) 
h 








a+») ge + 2 — 9) ps Mu +) — 160) 


+9) 


Hagamos tender ahora h a cero; puesto que. f(x + h) tiende a f(x), la 
regla queda inmediatamente establecida. 


Ejercicio: Demuéstrese que la función p(x) = x2 tiene la derivada p(x)=nxnt, 
(Escríbase 1 = x » an=1 y utilícese el principio de inducción.) 


Utilizando las reglas a) y b) podemos derivar cualquier polinomio: 


f(x) = ao + ax + 5t + anar; 
su derivada es: 
f(x) = ar + 2agx + 3aga? + -+ + nang? 


Como aplicación, podemos demostrar el teorema del binomio (véase 
pág. 24). Este teorema se refiere al desarrollo de (1 + x)” en forma 
de polinomio: é 


{ay = (1 + x) = 1 + ax + a? + agt? + ++ 4 anth, [1] 
y dice que el coeficiente ax está dado por la fórmula 


_n(n-— 1): (n—k-+1) 
g kt : 





ak [2] 
siendo, naturalmente, àn = 1. 

Ya hemos visto (pág. 430, Ejercicio) que la derivada del primer 
miembro de [1] es n(1 +.2)a1; pero, según el párrafo anterior, se 
tiene: 

n(1 + x)?-1 = a + 2022 + 3aga2 + ++» + Napr’, [3] 


Hagamos x = 0 en esta fórmula, de donde resulta n = d, que es 
precisamente el valor de [2] para k = 1. Derivando de nuevo [3], se 
tiene: 

n(n — 1) (1 + x)? = 202 + 3 : 2032 + -:> + n(n — 1)apan2, 


y haciendo x = 0, resulta n(n — 1) = 2a2, de acuerdo con la fórmu- 
la [2] para k = 2. 


Ejercicio: Demuéstrese [2] para k = 3, 4, y para un k cualquiera mediante el 
método de inducción matemática. 
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c) Derivada de un cociente. Si es 


12) 
a(z) = ww” 


se tiene: 
ga (a) — faja (a) 


AN ESTO 


La demostración queda como ejercieio a cargo del lector. 


Ejercicio: Mediante esta regla, obténganse las fórmulas de la página 432 para 
las derivadas de tg x y cot x, a partir de his desen x y cos x. Demuéstrese que las 
derivadas de sec x = 1/cos x y cosec x = 1/sen x son. resnectivamente, sen x/cos? x 
y, —Ccos x/sen? x. 


Podemos ahora derivar cualquier función que esté definida como 
cociente de dos polinomios; p. ej., 





la 
f(z) = iFa 
tiene la derivada 
8 —(1 + z) — (1 — z) 2 
o= —- aqp UFF 


Ejercicio: Derívese la función: f(x) = 1/xm = x-m, donde m es un entero po- 
sitivo. El resultado es: 


Fa) = — mena, 


d) Derivación de funciones inversas. Si 
y =f) y  =gu) 


son funciones inversas (p. ej., y = 1? y x = yy), sus derivadas son 


recíprocas: 
1 


gu) = To ° Dg): Dix) = 1. 

Se demuestra fácilmente este hecho recurriendo a los cocientes 
de diferencias: Ay/Ar y Az/Ay, respectivamente. Puede deducirse 
también de la interpretación geométrica de la función inversa dada 
en la página 292, si referimos la pendiente de la tangente al eje de 
las y en lugar de al de las z. 

Como. ejemplo, derivaremos la función 


m 1 


y = (8) = Vi = a, 
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que es la inversa de x = y™ (véase también el estudio más directo 
de esta cuestión para m =1/, hecho en la pág. 431). Puesto que 
la derivada de la última función es mym-1, se tiene: 





F 1 1 pes har 
f(x) = 1 m =n YY > 


1 
de donde, sustituyendo y = 1% y y-™ = 271, f'(x) = >, o bien, 


1 
1 — 
D(a11m) = m qm 


Como otro ejemplo más, derivaremos las funciones trigonométri- 
cas inversas (véase pág. 293): 
y =arctgx, que equivale a z= tg y. 


En este caso, la variable y, que se da expresada en radianes, está 
limitada al intervalo —1/gr < y < l/r para asegurar la univocidad 
de la función inversa. 

Según hemos visto (pág 432), D tg y = 1/cos?y, y dado que 
1/cos?y = (sen?y + cos?y)/cos?y = 1 + tg?y = 1 + 22, se tiene: 


D arc tgr = 172 
De la misma manera puede deducir el lector las siguientes fórmulas: 


1 


D arc cot x = -Ipa 
1 
D arc sen t = — m; 
Vi- a 
t 
D arc cos r = — —— 
Vi — r? 


Llegamos por fin a una regla general muy importante: 

e) Derivación de las funciones compuestas. Tales funciones están 
formadas por otras dos (o más) que son más sencillas (véase pág. 293); 
p. ej, Z = sen(y/x) se compone de z = sen y e y = yz; la función 
z = VI + yz se compone de z = y + y5 e y = yz; z = sen (x?) se 
compone de z = sen y e y = 7; z = sen 1/x se compone de z = sen y 
e y = ljzx. 
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y 











o x 
+ 
yese) 
y "sen(e) 
Fra. 272. Flia. 273, 


Si se dan dos funciones: 
2=gy) e y=1Í(), 

y se sustituye la última en la primera, obtenemos una función com- 
puesta: 

z = k(x) = g[H(x)] . 
Pues bien: vamos a ver que 

k(x) = g'(y)f'(z). [4] 
En efecto, si escribimos: 

klz) — ka) _ 11-71 YY 


rt — T Yy—Yy 1-2 


siendo yı = f(21) y zı = 9(y1) = Kk(x1), y hacemos tender zı a z, el pri- 
mer miembro tiende a k'(x), mientras que los dos factores del segundo 
miembro tienden a g'(x) y f'(x), respectivamente, de acuerdo con [4]. 

En esta demostración es necesario suponer que y: — y 40, ya 
que dividimos por Ay = yı — y, y no podemos utilizar valores de xı 
para los cuales yı — y = 0. Pero la fórmula [4] conserva su validez 
aun cuando Ay = Q0 en un entorno de qx; y es entonces constante, 
f(x) = 0, k(x) = g(y) es constante respecto a r (puesto que y no 
varía con 2), y, en consecuencia, k'(x) = 0, como debía ocurrir en 
este caso según [4]. El lector verificará los ejemplos siguientes: 

1 


Z ; k(x) = VI) —— ; 
k(x) = sen Vz, (12) = (cos a Y 


ka) = Vz + VI, ka= E 





k(x) = sen (12), k'(x) = cos (22) - 2x; 
1 1 1. 
k(x) = sen e? k(x) = — cos P F 


—1 —x 
=YVl-a, k(x) = — ¡== * 2 = — 
m = 2V1 — z2 V1-—a 
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Ejercicio: Combinando los resultados de las páginas 430 y 440, demuéstrese 
que la función 


m s 
I = Va = ™ 
tiene por derivada: 
sS 1 
(2) = Y 
ra) = 
Debe observarse que todas las fórmulas referentes a potencias 
de x pueden expresarse en una sola: 
Si r es un número racional cualquiera, positivo o negativo, la función 


1%) = æ 
tiene como derivada: 
[a= remi, 


Ejercicios: 

1. Efectúense las derivaciones de los ejercicios de la página 431, utilizando 
las reglas que acabamos de establecer. 

2. Derívense las siguientes funciones: 


f 1 
sen nz, (x3 — 3x2 — q 133, 1 + sen? x, x? sen — 
22? 





1 
1 4+ x2 


x sen T, 








lx itx ê 1 
arc sen (cos nx), tg 1 Zz aro tg > Via —— 


3. Determínense las segundas derivadas de algunas de las funciones prece- 
1 
l+a” 

4. Derívese cı (x — x1)? + Yı? + cala — xa)? + ya?, y demuéstrense las propie- 
dades de mínimo del rayo luminoso en la reflexión y refracción, que se.expusieron 
en el capítulo VII (págs. 341 y 392). Tanto la reflexión como la refracción tienén 
lugar en el eje de las x, y las coordenadas de los puntos extremos de la trayectoria 
son, respectivamente, 11, Y1, Y Ya, Ya. (Observación: La derivada de la función se 
anula en un solo punto; por tanto, dado que puede existir mínimo, pero no máxi- 
mo, no es necesario estudiar la segunda derivada.) 

Otros problemas de máximos y mínimos: 

5. Determínense los extremos de las siguientes funciones, dibújense sus res- 
pectivas gráficas y establézcase en qué intervalos la función es creciente, decre- 
ciente, cóncava o convexa:. 


x3 — 6 + 2, 2/(1 + 22), 22/(1 + x4), cos? zx. 


6. Estúdiense los máximos y mínimos de la función x? + 3ax + 1 en su de- 
pendencia respecto a a. 

7. ¿Qué punto de la hipérbola 2y2 — x? = 2 es el más próximo al punto 
x=0, y =3? 

8. Entre todos los rectángulos de área dada, determínese aquel cuya diago- 
nal sea mínima. 





dentes, y además, de arc tg x, sen? x, tg x y 
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9. Inscríbase el rectángulo de área máxima en la elipse 1?/a? + y?/b? = 1. 
10. Entre todos los cilindros circulares de volumen dado, determínese el de 
área minima. 


IV. LA NOTACIÓN DE LEIBNIZ, Y «LOS INFINITÉSIMOS» 


Newton y Leibniz sabían cómo obtener integrales y derivadas me- 
diante pasos al límite, pero los fundamentos del cálculo se hallaban 
oscurecidos por la incapacidad para reconocer al concepto de límite 
el derecho exclusivo como fuente de los nuevos métodos, Por muy 
sencillo que esto nos parezca ahora, después de haber aclarado com- 
pletamente el concepto de límite, ni Newton ni Leibniz se atrevieron 
a adoptar una actitud decidida. Su ejemplo influyó durante más de 
un siglo sobre el desarrollo de la ciencia matemática, período durante 
el tual se soslayaba el tema hablando de «cantidades infinitamente 
pequeñas», «diferenciales», «razón última», etc. La repugnancia con 
que se abandonaron por fin esos conceptos estaba profundamente 
arraigada en la actitud filosófica de la época y en la propia naturaleza 
de la inteligencia humana. Cabe hacerse este razonamiento: Por su- 
puesto, tanto la integral como la derivada se calculan mediante lími- 
tes; pero, después de todo, ¿qué son estos entes en sí mismos, fuera 
del particular paso al límite mediante el cual se los describe? Parece 
evidente que conceptos intuitivos tales como la superficie o la pen- 
diente de una curva tienen un significado absoluto en sí, sin necesidad 
de la.idea auxiliar de los polígonos inscritos o rectas secantes y de sus 
límites. Psicológicamente resulta muy natural que se intente buscar 
una definición adecuada de la superficie o de la pendiente, como 
«cosas en sí». Pero la renuncia a este deseo y la aceptación del paso al 
límite como única definición aceptable, desde el punto de vista cien- 
tífico, está de acuerdo con la madurez científica que ha abierto tantas 
veces el camino al progreso. En el siglo xvir no existía una tradición 
intelectual que permitiese tal radicalismo filosófico. 

La tentativa de Leibniz de «explicar» la derivada empezaba co- 
rrectamente con el cociente de diferencias de una función y = f(x): 


Ay _ ie) -io 
Axr zı- 

Para designar el límite, esto es, la derivada que nosotros repre- 
sentamos por f'(x) (siguiendo la notación introducida por Lagrange), 
Leibniz escribía: 

dy 
da? 
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reemplazando el símbolo A de diferencias por el «símbolo diferencial» 
d. No se plantea ninguna dificultad ni existe ningún misterio si en- 
tendemos bien que este símbolo indica solamente que debe efectuarse 
el paso al límite: Ax > 0 y, en consecuencia, Ay —> 0. Antes de pasar 
al límite se elimina el denominador Ax del cociente Z o se transforma 
de tal manera que pueda efectuarse sin dificultad el proceso de límite. 
Éste es siempre el punto crucial en la derivación. Si hubiéramos in- 
tentado hacerlo sin esa simplificación previa, habríamos obtenido la 
relación carente de sentido Ay/Ar = 0/0, por la cual no tenemos el 
menor interés. Sólo se producen el misterio y la confusión si seguimos 
el camino de Leibniz y de muchos de sus sucesores, y decimos algo 
como esto: «Ax no tiende a cero; por el contrario, el «último valor» 
de Az no es cero, sino «una cantidad infinitamente pequeña», una 
«diferencial», llamada dx, y, análogamente, Ay tiene un «último» valor 
infinitamente pequeño, dy. El cociente verdadero de estas diferen- 
ciales infinitamente pequeñas es un número ordinario: f'(x) = dy/dx.» 
Por eso Leibniz llamó a la derivada «cociente diferencial». Esas can- 
tidades infinitamente pequeñas eran consideradas como una nueva 
clase de números, no iguales a cero, sino más pequeñas que cualquier 
número real. Sólo los que poseían una verdadera intuición matemá- 
tica podían captar este concepto, por lo que se creía que el cálculo 
era genuinamente difícil, ya que no todos tienen o pueden desarrollar 
esa intuición. De igual manera, se consideraba la integral como una 
suma de infinitas «cantidades infinitamente pequeñas» f(x)dx, y se 
tenía la creencia de que dicha suma era la integral o área, considerán- 
dose como algo accesorio el cálculo de su valor mediante el límite de- 
una suma finita de números ordinarios, f(x¡)Ax. Hoy damos de lado 
el deseo de una explicación «directa» y definimos la integral como 
límite de una suma finita. De esta manera, se eliminan todas las difi- 
cultades y se asienta sobre una base sólida todo lo que es fundamen- 
tal en el cálculo. 

A pesar de este posterior desarrollo, se retuvo la notación de 
Leibniz, dy/dx, para la derivada f'(w), y f f(a) de para la integral, 
pues ha demostrado ser extremadamente útil. No plantea ningún in- 
conveniente si recordamos que son simples símbolos para representar 
el paso al límite. La notación de Leibniz ofrece la ventaja de que los 
límites de cocientes y de sumas pueden manejarse en ciertos aspectos 
«como si» realmente fueran cocientes o sumas. El poder sugestivo de 
esos símbolos ha inducido muchas veces a ciertas personas a atri- 
buirles un significado que está por entero fuera de la matemática. 
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Si nos resistimos a esa tentación, la notación de Leibniz es, al menos, 
una excelente taquigrafía, que sustituye a la notación explícita más 
complicada del paso al límite. De hecho es indispensable en ciertos 
aspectos más avanzados de la teoría. 

Por ejemplo, la regla d) de ia página 439 para derivar la función 
inversa x = g(y) de y = f(x) dice que g'(y) f'(y) = 1. En la notación 
de Leibniz se tiene: 

dx dy 

dy dr” 
«como si» las «diferenciales» pudieran reducirse en una expresión que 
parece ser un quebrado ordinario. Igualmente, la regla e) de la pá- 
gina 440, para la derivada de una función compuesta z = k(x), siendo 
z = g(y), e y = f(x), puede expresarse así: 


dz dz dy 
dx dy dx 

La notación de Leibniz tiene además la ventaja de fijar la aten- 
ción en las cantidades x, y, z, más que en su conexión funcional ex- 
plícita. Esta última expresa un procedimiento, una operación, que pro- 
duce una cantidad y a partir de otra x; p. ej., la función y=f(x) = qx? 
produce una cantidad y igual al cuadrado de la cantidad x. La operación 
(elevar al cuadrado) requiere la atención del matemático, pero el físico 
y el ingeniero se interesan en primer lugar por las propias cantidades. 
De ahí que el énfasis de la notación de Leibniz sobre las cantidades 
sea particularmente atractivo para los que se interesan por la ma- 
temática aplicada. 

Podemos añadir otra observación. Mientras que «las diferenciales» 
se han descartado definitivamente y de forma poco honorable, en 
cuanto cantidades infinitamente pequeñas, la palabra diferencial ha 
entrado por la puerta falsa, pero para designar un concepto legítimo 
y útil. Significa ahora simplemente una diferencia Ar cuando Ar es 
pequeño en relación con las otras cantidades que intervienen en el 
cálculo. No resulta oportuno examinar aquí el valor de este concepto 
en el cálculo aproximado, ni tampoco podemos considerar otras no- 
ciones matemáticas perfectamente legítimas, que se designan con el 
mismo nombre de «diferencial», algunas de las cuales han demostrado 
ser sumamente útiles en el cálculo y en sus aplicaciones a la geometría. 


V. EL TEOREMA FUNDAMENTAL DEL CALCULO 


1. El teorema fundamental.—La noción de integral, y hasta cierto 
punto la de derivada, estaban bastante desarrolladas antes de los 


COURANT.—16 
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trabajos de Newton y Leibniz. Para que se iniciara la prodigiosa evo- 
lución del nuevo análisis matemático sólo era necesario un descu- 
brimiento muy sencillo. Los dos pasos al límite aparentemente inco- 
nexos en que se basan tanto la derivación como la integración de una 
función están íntimamente relacionados. De hecho son inversos 
entre sí, como la suma y la resta o la multiplicación y la división. No 
existen por separado cálculo diferencial y cálculo integral, sino que 
hay un solo cálculo. 

El mérito enorme de Newton y Leibniz consiste en haber sido los 
primeros en reconocer y utilizar este teorema fundamental del cálculo, 
Naturalmente, su descubrimiento se encontraba en la trayectoria del 
pensamiento científico y resulta natural 
que distintas personas llegaran a com- 
prender tal situación, independientemen- 
te y casi al mismo tiempo. 

Para formular el teorema fundamen- 
tal, consideremos la integral de una 
función y = f(x) desde el límite inferior 

fijo a al límite superior variable z. 
a como fun- Para evitar la confusión entre el límite 

superior de integración x y la variable x 
que aparece en el símbolo f(x), escribiremos esta integral de la manera 
siguiente (véase pág. 422): 





px 


F(x) -| f(u) du, - LH] 


para indicar que deseamos estudiar la integral en cuanto funeión F(x) 
del extremo superior x (Fig. 274). Esta función F(x) es el área bajo 
la curva y = f(u) desde el punto u = a hasta el punto u = z. Algunas 
veces se llama integral «indefinida» a esta F(x) que depende del ex- 
tremo superior variable. 

El teorema fundamental del cálculo dice lo siguiente: 

La derivada de la integral indefinida [1] como función de x es igual 
al valor de f(u) en el punto x: 

F(x) = [(x). 

En otras palabras, el proceso de integración que conduce de la fun- 
ción f(x) a la F(x) queda anulado o invertido por el de derivación apli- 
cado a F(x). 

Intuitivamente, la demostración es muy sencilla; depende de la 
interpretación de F(x) como área y resulta oscura si se intenta 
representar F(x) por una curva y la derivada F'(x) mediante su pen- 
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diente. En lugar de esta interpretación geométrica inicial de la deri- 
vada, retengamos el significado geométrico de la integral F(x) y pro- 
eedamos analíticamente a derivar F(x). La diferencia 


F(x1) — F(x) 


es sencillamente el área entre x y z en la figura 275, y vemos que está 
comprendida entre los valores (xı — x)m y (xı — 2)M; es decir: 


(xı — x)m < Fit) — F(z) < (21 — 23M, 


donde M y m representan, respectivamente, el máximo y el minimo 
de f(u) en el intervalo (x, xı). En efecto, dichos productos son las 





Fic. 275. — Demostración del teorema fundamental. 


áreas de dos rectángulos tales que el uno incluye el área de la curva, 
mientras que el otro está incluído en esta. En cónsecuencia: 


F(x) — Fiz) 
a.” M 


Supondremos que la función f(u) es continua, por lo que, tuando 
xı tiende a x, M y m tienden ambos a f(x). De este hecho resulta: 
; F(z) — F(z) 

F(x) = lma = f(x), 12] 
como habíamos afirmado. Intuitivamente, esto expresa que la «velo- 
cidad» con que varía el área bajo la curva y = f(x) cuando z crece, 
es igual a la altura de la curva en el púunto zx. 
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En algunos textos, este punto importante del teorema fundamen- 
tal queda oscurecido por una nomenclatura mal elegida. Muchos auto- 
res introducen primero la derivada y definen después la «integral inde- 
finida» como la inversa de la derivada, afirmando que G(x) es una 
integral indefinida de f(x), si 


G(2) = f(x). 


Así, este procedimiento relaciona inmediatamente la derivación 
con la «integral», y después se introduce el concepto de «integral defi- 
nida» como área o como límite de una suma, sin- advertir explicita- 
mente que en este caso la palabra «integral» significa ahora algo por 
completo distinto. De esta manera, se introduce subrepticiamente el 
punto fundamental de la teoría, lo que dificulta seriamente los esfuer- 
zos del estudiante para alcanzar una comprensión clara de estas cosas. 
Resulta preferible denominar a las funciones G(x), para las cuales 
G(x) = f(x), funciones primitivas de f(x) y no «integrales indefinidas». 
En esta forma, el teorema fundamental puede enunciarse así: 

La función F(x), integral de f(u), cuyo extremo inferior es fijo y 
variable el superior x, es una función primitiva de f(x). Í 

Decimos «una» función primitiva y no «la» función primitiva, pues es 
evidente que si G(x) es una función primitiva de f(x), también lo será 


H(z) = G(x) + e (siendo c una constante arbitraria), 


puesto que H'(x) = G'(x). También se verifica la propiedad recíproca. 
Dos funciones primitivas G(x) y H(x) sólo pueden diferir en una cons- 
tante. Pues la diferencia U(w) = G(x) — H(x) tiene la derivada 
U'(x) = G (a) — H'(x) = f(x) — f(x) = 0, y, por tanto, es constante, 
ya que una función representada por una gráfica horizontal debe ser 
constante. 

Esto nos conduce a una importante regla para determinar el valor 
de una integral entre a y b, siempre que conozcamos una función 
primitiva G(x) de f(x). De acuerdo con el teorema fundamental, 





F(x) = | f(u) du 


2 
es también una primitiva de f(x). Por tanto, F(x) = G(x) + c, donde 
ces una constante que se determina recordando que F(a)= | f(udu=0, 


conduce a la igualdad 0 = G(a) + c; o sea, c = —G(a). Así, la inte- 
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gral definida entre los límites a y x será F(x) = f f(u)jdu = G(x) — 
—G(a), y si escribimos b en lugar'de zq: a 


d 
f f(u) du = G(b) — G(a), 18] 
prescindiendo de cuál sea la particular función primitiva G(x) elegida. 
En otras palabras: 


b 
Para calcular la integral definida Í f(x)dx sólo necesitamos deter- 


minar una función G(x) tal que G'(x) = f(x), formando entonces la 
diferencia G(b) — G(a). 

2. Primeras aplicaciones. Integración de x", cos x, sen x, arc tg x. 
Es imposible dar aquí una idea adecuada del alcance del teorema 
fundamental, pero los ejemplos siguientes proporcionarán alguna indi- 
cación. Con mucha frecuencia, en los problemas reales que aparecen 
en mecánica, física o en matemática pura, se tiene que hallar el valor 
de una integral definida. El método directo de determinar la integral 
como límite de una suma puede resultar difícil. Por otra parte, según 
hemos visto anteriormente en III, es relativamente fácil efectuar cual- 
quier derivación y acumular toda la información obtenida por este 
procedimiento, con lo que puede invertirse cada fórmula de deriva- 
ción G'(x) = f(x), proporcionando así una función primitiva G(x) de 
f(x). Mediante la fórmula [3], se puede calcular la integral de f(x) 
entre dos límites cualesquiera. 

Por ejemplo, si queremos encontrar la integral de 2%, 13 o xn, po- 
demos proceder ahora de manera mucho más sencilla que anterior- 
mente. Por la fórmula de derivación de x2 sabemos que la derivada 
de x? es nzn-1, por lo que la derivada de 








ga+l 
E! (n 4 —1) 
es: +1 
n 
2 = = 
Gx) ari IA = g’, 


En consecuencia, x2+1/(n + 1) es una función primitiva de f(x) =x2, 
y se tiene inmediatamente: 


b bn+1 — anti 
fra ==> 


Este proceso es mucho más sencillo que el de hallar directamente 
la integral como límite de una suma. 
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Antes hemos establecido, con mayor generalidad, que para cual- 
quier valor racional s, positivo o negativo, la función xs tiene como 
derivada sxs-1, y, por tanto, para s = r + 1, la función 





G(x) = x+ 


r41 


tiene la derivada f(x) = G'(x) = ær. (Se supone r # —1; es decir, 
s 40). En consecuencia, ar+/r + 1 es una función primitiva o «inte- 
gral indefinida» de xr, y se tiene (para a y b positivos, y r + —1): 





b 
1 
Y = +. +1 
f> dx ERR {br ar+1), 1H] 


En [4] suponemos que en el intervalo de integración, el integrando xr está 
definido y es continuo, lo que excluye x = 0, si r < 0. En consecuencia, en este 


caso se supone que a y b son positivos. 


Para G(x) = —cos x, tenemos que G'(x) = sen x, de donde resulta: 








2 
Í sen x dx (cos a — cos 0) = 1 — cosa. 
o 


De forma análoga, puesto que para G(x) = sen x se tiene G(x)= 
= cos x, se deduce: 


a 
Í cos x dx = sen a — sen 0 = sen a. 
o 


Se obtiene un resultado particularmente interesante de la fórmula 
de derivación de la función arco tangente, D arc tg x =1/(1 + 22), 
de donde la función arc tg x es una primitiva de 1/(1 4- x2), y de la 
fórmula [3] se deduce el resultado siguiente: 


b 


g — ) = EErEE A . 
arc tg b arc tg ( E Far dx 


Pero, arc tg 0 = 0, ya que a un ángulo nulo corresponde también 
una tangente nula, por lo que podemos escribir: 


b» 1 
arc tg b = — dz. 5 
are tg fi Fx [5] 


En particular, si b = 1, arc tg b será igual a 7/4, puesto que el 
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valor 1 de la tangente corresponde a un Y 
ángulo de 450, o 1/4 si se mide en radia- 
nes. Así, se obtiene la notable fórmula: 


A 
1/4 = i ra” [6] 
Esto demuestra que el área bajo la o 1 z 
curva de la función y = 1/(1 + 2), 
desde x = 0 hasta x = 1, es igual a un e dd 
cuarto de la de un círculo de radio 1. 
3. La fórmula de Léibniz para 7. -Este último resultado conduce 
a uno de los más bellos descúbrimientos matemáticos del siglo xvi: 
la serie alternada de Leibniz para r. 


mo 1i 1 1 í 1i 1 
aE ER E a m 


4 1 3 5 7 9 nu 
Mediante el símbolo + ..., queremos expresar que la sucesión de 
las «sumas parciales» finitas, formadas al interrumpir la expresión a 
la derecha después de tomar-n términos, converge hacia 7/4 cuando n 
crece indefinidamente. 
Para demostrar esta famosa fórmula, basta recordar la progresión 
geométrica finita: 











A A ++ c+ n—1 
Ea q+4 gua, 
o bien: 
2 1 q 
Ea, t. n=. 
yoq repek +4 +127 
En esta identidad algebraica hacemos q = —«x? y obtenemos: 
1 Mm a y (A) Ra [8] 


1 +22 


donde el «resto» Rn es: 
x2n 
Ra = (Dir 
Ahora puede integrarse la ecuación [8] entre los límites 0 y 1; 
de acuerdo con la regla a) de la página 437, deberemos escribir a la 
derecha la suma de las integrales de los sucesivos términos, y apli- 


452 EL CÁLCULO INFINITESIMAL [carp. 8 





b 
cando la fórmula [4] resulta: Í x®dyr = (bm+1 — qm+1)/(m + 1); o sea, 


1 
[seras = 1/(m + 1), y finalmente, 


0 








1 dx i 1 1 1 E. 
i PA Saian ai aa ca —1yn- = y 
ker zty Oy tU tD t Ta, 19] 


A 1 xn 
siendo Tn = a fa 
Según [5], el segundo miembro de [9] es igual a 1/4, y la diferen- 
cia entre x/4 y la suma parcial 
(DT: 


1 1 
Srp il — e. AS 
i zt t toni 


es 7/4 — Sn = Tn. Queda por demostrar que Tn tiende a cero al cre- 


cer n. Pero, por ser 
xn 


e a < x2n (para 0<xw<l). 
b b 
si recordamos la fórmula [13] de I, según la cual, Í f(x)dx <f g(x)dx 
si f(x) < g(x) y a < b, vemos que 5 j 
1 32n "i 
l mi-f a< | xn dx; 


o1 +2? 0 


y como el segundo miembro es igual a 1/(Qn + 1), según hemos com- 
probado antes (fórmula [4]), vemos que | Ta | < 1/Qn + 1). Por tanto, 





< 


n 





i3 
PA 





2n +1 


Esto demuestra que Sr tiende a 7/4 al aumentar n, ya que 1/(2n +1) 
tiende a cero. Queda así demostrada la fórmula de Leibniz. 


VI. LAS FUNCIONES EXPONENCIAL Y LOGARÍTMICA 


Los conceptos fundamentales del cálculo proporcionan una teoría 
más adecuada de las funciones logarítmica y exponencial que el mé- 
todo «elemental» utilizado en la enseñanza media. Allí se empieza 
generalmente por las potencias enteras an de un número positivo a, 


m 
y se define después al/m = «/a, obteniendo así el valor de ar para 
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cualquier número racional r = n/m. A continuación se define el valor 
de ax para cualquier número irracional x de modo que aX sea una 
función continua de x, punto delicado, que se omite en la enseñanza 
elemental. Finalmente, se define el logaritmo de y en base a, 


T= loga y, 


como la función inversa de y = aX. 

En la teoría que sigue de estas funciones, basada en el cálculo, se 
invierte este orden. Empezamos por el logaritmo y obtenemos des- 
pués la función exponencial. 

1. Definición y propiedades del logaritmo. El número «e» de Euler. 
Definiremos el logaritmo, o, más concretamente, el «logaritmo na- 
tural» F(x) = log x [dejamos para más adelante (pág. 457) su relación 
con el logaritmo de base 10], como el área comprendida bajo la curva 
y = lju desde u = 1 hasta u = x, o, lo que significa lo mismo, me- 
diante la integral 


mod 
F(z) = log x -f — du [1] 
1u 


(véase Fig. 5). La variable x puede ser un número positivo cualquiera. 
Queda excluído el cero, ya que el integrando tiende a infinito cuando 
x tiende a cero. 

Resulta natural que estudiemos la función F(z), pues sabemos que 
la primitiva de cualquier potencia x? es una función x2+1/(n + 1) del 
mismo tipo, excepto para n = 1. En este último caso, el denominador 
n + 1 se anula y la fórmula [4] de la página 450 carece de signifi- 
cado. Así cabe esperar que la integración de 1/x o de 1/u conduzca 
a algún tipo nuevo—e interesante—de función. 

Aunque consideramos [1] como definición de la función log x, no 
podremos decir que la conocemos hasta que hayamos deducido sus pro- 
piedades y encontrado medios para calcularla numéricamente. Es éste 
un ejemplo típico de los métodos modernos de la matemática, consis- 
tentes en empezar por conceptos generales, tales como área e integral, 
estableciendo seguidamente definiciones, como la [1], que se basan 
en ellos, deduciendo después las propiedades de los entes así defini- 
dos y obteniendo finalmente expresiones explícitas para su cálculo 
numérico. 

La primera propiedad importante de log x es una consecuencia 
inmediata del teorema fundamental de V, el cual proporciona la 
ecuación 

F(x) = 1/z. [2] 
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De [2] se deduce que la derivada es siempre positiva, lo que con- 
firma un hecho evidente: que la función log x es monótona creciente 
para valores crecientes de x. 

La principal propiedad del logaritmo queda expresada por la 
fórmula 

log a + log b = log (ab). [3] 


Es bien conocida la importancia de esta fórmula en la aplicación 
práctica de los logaritmos al cálculo numérico. Intuitivamente, la fór- 
mula [3] se podría obtener considerando las áreas que definen las tres 
cantidades log a, log b, y log (ab). Pero preferimos deducirla mediante 
un razonamiento típico del cálculo. Junto con la función F(x) = log x, 
consideremos la siguiente: 


k(x) = log (ax) = log w = F(w), 


donde w = f(x) = ax, siendo a una constante positiva cualquiera. 
Es fácil derivar k(x) mediante la regla de la página 441: k'(x) = 
= F'(w)f'(x). De [2], y puesto que f'(x) = a, resulta: 


k'(x) = afw = ajax = 1/x. 


En consecuencia, k(x) tiene la misma derivada que F(x), y de 
acuerdo con lo dicho en la página 448, tendremos: 


log (ax) = k(x) = F(x) + e, 


donde c es una constante que no depende del valor particular de zx, 
y que se determina sin más que sustituir x por el número 1. De la 
definición [1], se deduce que 


F(1) = log1 = 0, 


puesto que la integral definida tiene iguales ambos extremos para 
= 1. Se obtiene así: 





k(1) = log (a:1) = log a = log 1 + c = c, 
lo que proporciona c = log a; o sea, que para todo x se verifica 
log (ax) = log a + log x. [3a] 


Haciendo x = b, se obtiene la fórmula buscada [3]. 
En particular, para a = x, encontramos sucesivamente: 


log (x2) = 2 log x, 
log (13) = 3 log x, 


log (12) = n log zx. [4] 
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La ecuación [4] prueba que al aumentar x los valores de log zx 
tienden a infinito, pues el logaritmo es una función monótona cre- 
ciente, y se tiene, p. ej., 

log (22) = n log 2, 


que tiende a infinito con n. Además, 


Í 1 1 
0 = log 1 = log (+ a +) = log x + log 55 
de forma que 
1 
leg = — log z. [5] 


Finalmente, 
log xr = r log x [6] 


para cualquier número racional r = mjn. En efecto, si se hace 1? = u, 
se tiene: 
Ta 
n log u == log u? = log 2” e log xm = mlog 2; 


de donde, 


1 
D œ — 
log x og 2. 


Dado que log x es una función continua y monótona de zx, que 
toma el valor 0 para x = 1, y tiende a infinito con x, debe existir 
un número mayor que 1, tal que para él se tenga log x = 1. 





FiG. 277. Fie. 278. 


Siguiendo el ejemplo de Euler, llamaremos e a este número (más 
adelante se demostrará la equivalencia con la definición de la pági- 
na 309). Así, pues, e está definido por la igualdad 


loge = 1. [7] 
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Hemos introducido el número e mediante una propiedad intrín- 
seca que asegura su existencia. Ahora proseguiremos nuestro análisis, 
del que se deducirán como consecuencia fórmulas explícitas que pro- 
porcionan aproximaciones tan exactas como se desee para el cálculo 
numérico de e. 

2. La función exponencial.—Resumiendo los resultados anteriores, 
vemos que la función F(x) = log x tiene el valor cero para x = 1; 
crece monótonamente hasta infinito, pero con pendiente 1/x decre- 
ciente, y para valores positivos de x menores que 1, está dada por 
log 1/x tomado con signo negativo, por lo que log x tiende a —oo 
cuando x —> Q. 

Debido al carácter de monotonía de y = log x, podemos conside- 
rar la función inversa 

x = E(y), 


cuya gráfica (Fig. 278) se obtiene de la forma usual a partir de la de 
y = log x (Fig. 277); está definida para todo valor de y entre —oo 
y +00. Cuando y tiende a —oo, E(y) tiende a cero, y cuando y tiende 
a + oo, E(y) tiende a + oo. 
La función E tiene la siguiente propiedad fundamental: 
Ela) - E(b) = Ela + b) [8] 


para cualquier par de valores a y b. Esta igualdad es sólo otra manera 
de expresar la ley [3] del logaritmo. Pues si es E(b) = x, E(a) = z 
(es decir, b = log x; a = log z), se tiene: i 


log xz = log x + log z = b +a, 
y, en consecuencia, resulta: 
E(b + a) = xz = Ela) * E(b), 
como se quería demostrar. Ya que, por definición, log e=1, tenemos 
E(1) =e, 


de donde se sigue, teniendo en cuenta [8], que e=E(1)E(1)=E(2), 
etcétera, En general, 
E(n) = e! 


para cualquier entero n. De forma análoga, E(1/n) = el/n, de modo 
que E(p/q) = E(1/ù -++ E(l/q) = [el/a]»; por tanto, haciendo p/q=r,. 
se tiene, finalmente, 

E(r) = er 
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para cualquier valor racional r. Resulta así apropiado definir la opera- 
ción de elevar el número e a una potencia irracional escribiendo 


ey = Ely) 


para cualquier número real y, puesto que la función E es continua para 
todos los valores de y, e idéntica al valor de eY para y racional. Ahora 
podemos expresar la ley fundamental (8] de la función E o función 
exponencial, como también se llama, mediante la ecuación 


es ed = ento, [9] 


que queda así demostrada para números racionales o irracionales 
arbitrarios a y b. 

En toda esta discusión acerca de las funciones exponencial y loga- 
rítmica, nos hemos referido al número e, como la «base» o «base na- 
tural» de los logaritmos. Es fácil pasar de la base e a cualquier otro 
número positivo. Comencemos por considerar el logaritmo (natural) 


a = log a, 

de donde se deduce que 

a = e% = elga, 
Definamos ahora a* mediante la expresión compuesta 

z = aZ = eax = ex loga, [10] 

Por ejemplo, 

10x = ex log 10, 

Llamamos logaritmo de base a a la función inversa de aX, y vemos 

en seguida que el logaritmo natural de z es x veces a; en otras palabras, 
el logaritmo de un número: z en base a resulta de dividir el logaritmo 


natural de z por el logaritmo natural de a, que es una constante. 
Para a = 10, este número, con cuatro cifras exactas, es 


log 10 = 2,303. 


3. Fórmulas de derivación de e*, a*, x*.—Puesto que hemos defi- 
nido la función exponencial E(y) como la inversa de y = log x, de la 
regla para derivar funciones inversas (véase III) resulta: 
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es decir: La función exponencial natural es idéntica a su derivada: 
E'(y) = Ely). [11] 


Éste es, en realidad, el origen de todas las propiedades de la fun- 
ción exponencial y la razón fundamental de su importancia en mate- 
mática aplicada, según se verá en los párrafos siguientes. Utilizando 
la notación de Leibniz, podemos escribir [11] de la manera siguiente: 


d 
qe = ex, fia] 


Con mayor generalidad, derivando la función compuesta: f(x) =e*x, 
se tiene, aplicando una conocida fórmula, 


Fx) = erx = af(x). 
De donde, para a = log a, encontramos que la función 
f(x) = ar 
tiene la derivada 


f'(x) = ax log a. 


Podemos definir ahora la función 
f(z) = xs 
para cualquier exponente real s y variable positiva x, escribiendo 


15 = es 1g x, 


Aplicando nuevamente la regla de derivación de las funciones com- 
puestas, f(x)=esz, z=log x, encontramos f' (1) =sesz(1/x)=sx5(1/2), y, 
en consecuencia, 

F(x) = sxs, 


de acuerdo con un resultado anterior para s racional. 

4. Expresiones explícitas de e, e* y log x, en forma de límite. 
Con el fin de hallar fórmulas explícitas para estas funciones, utiliza- 
remos las reglas de derivación de las funciones exponencial y logarít- 
mica. Dado que la derivada de la función log x es 1/x, por medio de 
la definición de derivada obtenemos la relación 


log xı — log x 
TI 


1 
en = lím cuando zi> x. 
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Si escribimos xı = x + h y hacemos tender h a cero siguiendo 
los valores de la sucesión 


h = 1/2, 1/3, 1/4, ..., 1/n,..., 


resulta, aplicando las reglas del cálculo logarítmico, 


1 
og (z + $) — 1082 LE pa í 
AE Y” A x = log l+- a 


Si se pone z = 1/x y se hace uso nuevamente de las mismas re- 
glas, se encuentra: 


z n 
z = lím log [( + +) | cuando n -> 00; 


o sea, mediante la función exponencial, 





n 
z 
ez = lím (: + 2) cuando n —> oo. f12] 


He aquí la famosa fórmula que define la función exponencial en forma 
de límite. En particular, para z = 1, se tiene: 

e = lím (1 + 1/n)», (13) 
y para z = —1, 


1 
Pe lím (1 — 1/m)a, [13a] 


Estas expresiones conducen inmediatamente a desarrollos en for- 
ma de serie. Mediante el teorema del binomio, se tiene: 





i xy” f xz n(n — 1) z3 n(n — 1) (n — 2) 23 za 
ra dr TI 31 PR E 


o sea, 


(a ++ 
aca AA E 


Resulta conveniente, y no supone gran dificultad, justificar com- 
pletamente (se omiten aquí los detalles) que es posible efectuar el paso 
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al límite para n > co, reemplazando en cada término 1/n por 0. Esto 
proporciona la famosa serie para ex: 


x2 x3 
+5 





xr 
e= 1+ 


n 2 PR [14] 


y, en particular, se obtiene para e el desarrollo 








MENGE. 1 1 
emi tat A A 
que establece la identidad de e con el número definido en la pági- 
na 309. Para x = —1Í, se tiene la serie 
1 1 1 1 1 
=- = — — q — — + A 


e 21 31 41 51 


la cual proporciona una excelente aproximación numérica con sólo 
muy pocos términos, siendo el error total introducido al considerar 
únicamente los n primeros términos inferior al valor absoluto del 
término de lugar n + 1. 
Si utilizamos la fórmula de derivación de la función exponencial, 
puede obtenerse una expresión interesante para el logaritmo. Se tiene 
en— 1 en — e? 


lím k = lím h = 1 





cuando h —> 0, debido a que este límite es la derivada de eY para 
y = 0, y ésta es igual a e° = 1. Sustituyamos en esta fórmula h por 
los valores z/n, donde z es un número arbitrario, y n toma los suce- 
sivos valores enteros. Obtenemos así 


ezin — 1 
— > 1, 





n 


Ve —1)>z 


al tender n a infinito. Si hacemos z = log x o e2 = x, se obtiene 
finalmente 
aja 
log x = lím n(Vz — 1) cuando n> œ. [15] 


Como 4/1 —> 1 cuando n —> co (véase pág. 334), [15] representa el 
logaritmo como limite de un producto, uno de cuyos factores tiende 
a cero y el otro a infinito. i 


_ Ejemplos y ejercicios varios. — Al incluir las funciones exponencial y logarítmica 
podemos considerar ahora una amplia clase de funciones y tener acceso a nume- 
rosas aplicaciones. 
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Obténganse las derivadas de: 
1. x(log x — 1). 

2. log (log x). 

3. log (£ + V1 +22). 
4. log (x + vi — 12). 
5. ex 
6 
7. 
8. 





eeX (función compuesta ež, con z = ex). 
ax (Hágase xx = ex 108 x), 
log tg x. 
log sen z; log cos x. 

10. x/log x. 

Determínense los máximos y mínimos de las funciones: 

11. xex, 

12. xle-x, 

13. xe-ax, 

*14, Determínese el lugar geométrico de los máximos de la curva y = ze-%x, 
al variar a. 

15. Demuéstrese que las sucesivas derivadas de la función e-x? están formadas 
por el producto de la función e-x? y un polinomio en zx. 

*16. Demuéstrese que la n-ésima derivada de e-1/x? es igual a esta misma fun- 
ción, multiplicada por un polinomio de grado 2n — 2, dividido por xn, 

*17. Derivación logarítmica. Utilizando la propiedad fundamental del logaritmo, 
puede efectuarse a menudo la derivación de un producto de manera más sencilla. 
Para un producto de la forma: 


p(2) = hladía(a) => fala), 
D(log p(=)) = D(log [1(x)) + D(log fa(x)) + -** + D(08 fa(2)), 


de donde, por la regla de derivación de las funciones compuestas, resulta: 


$ 


Pa) KE h) h'a) 
PA ha Fra? O E O 














Utilícese este procedimiento para derivar 
a) x(x + 1)(@ +2) (@ +n); b) zeex, 


5. Serie logarítmica. Cálculo numérico.—La fórmula [15] no es 
adecuada para el cálculo numérico de los logaritmos. Una expresión 
explícita distinta y más útil, de gran importancia teórica, se presta 
mejor para este propósito. La obtendremos siguiendo el método utili- 
zado en la página 451 para calcular v, a partir de la definición 
del logaritmo por la fórmula [1]. Se necesita un pequeño paso pre- 
vio; en vez de operar con log x, intentaremos expresar y = log (1 + x), 
compuesta por las funciones y = log z y z =x + 1. Tenemos asi 
dy dy dz 1 1 i 
die d2 Fr Pd 1 Ea de donde resulta que log (1 + x) es 
una función primitiva de 1/(1 + xz), y de ello deducimos, por el teo- 
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rema fundamental, que la integral de 1/(1+u), desde 0 a zx, es igual 
a log (14-x)—log 1=log (1+x); simbólicamente: 





* 1 
log (1 + 2) -f Fu du. [16] 
(Naturalmente, esta fórmula puede deducirse intuitivamente de la in- 
terpretación geométrica del logaritmo como área. Véase pág. 422.) 

En la fórmula [16] introducimos, como hicimos en la página 452, 
la serie geométrica para (1 + u)1, escribiendo 

I 1 2 | 3 4 1yn-1¿¿n-1 y 1y u” 
Lia u+u u3 + + (1) riu A 











donde, por precaución, preferimos no escribir una serie indefinida, 
sino compuesta de un número de términos, más un resto 


n 


+u 





Rp = GAS 


Al introducir esta serie en [16] hacemos uso de la regla de que 
una suma (finita) de ese tipo puede integrarse término a término. 
La integral de us desde O hasta x es xs+l/(s + 1), y se obtiene inme- 
diatamente 








qn 
log(l+2)=x - + ++ + (DL + Tas 
donde el resto Tn está dado por 


x un 
Ta = (— 1). du. 


Demostremos ahora que Tn tiende a cero al aumentar n, siempre 
que x sea mayor que —1 y no exceda a +1; en otras palabras, para 





=1<zu<il, 


debiendo observarse que se incluye el valor x = +-1, pero queda ex- 
cluído el z = —1. De acuerdo con nuestra hipótesis, en el intervalo de 
integración, u es mayor que un número —«, que puede ser próximo 
a —1, pero que, en todo caso, es mayor que él, por lo que se tiene 


0<1—a=<1+u. De ahi que en el intervalo de 0 a x, tengamos: 
. 
| l+u 


¡ua 








< 





la” 
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x 
Í un du 
o 


se 1. |x ja+ 1 1 
al< l-a n+1 Sia n41 


y, por tanto, 





| Ta] < 


, 


l—-a 








o sea, 











Puesto que 1 — a es constante, vemos que al tender n a infinito 
esta expresión tiende a cero, de forma que de 














E e a Ma 1 1 i 
A a a ere TFT 
se obtiene la serie 
log (1 2 z z 18 
ogl paeme AO, [18] 
que es válida para —1 < z < 1; 
En particular, para x = 1, resulta el curioso resultado: 
lbg2=1— 4 > > 19 
082 = A [19] 


fórmula con una estructura similar a la obtenida para 7/4. 

La serie [18] no constituye un medio práctico para calcular los 
valores numéricos de los logaritmos, puesto que su intervalo de validez 
está reducido a: los valores de 1 4+ x comprendidos entre 0 y 2, y 
debido también a que su convergencia es tan lenta que es necesario 
tomar muchos términos para obtener un resultado medianamente 
aproximado. Puede obtenerse una expresión más adecuada por medio 
del siguiente artificio. Reemplazando x por —x en [18], encontramos: 


log (1 — xz) = — z —- > -=--> -o 120] 


Restando [20] de [18] y mediante la fórmula log a — log b = 
= log a + log (1/b) = log (ajb), se tiene: 





l+zx as ad 

ar Ss. , A TE T A 21 
log- aer EHE ) [21] 
No sólo esta serie converge mucho más de prisa, sino que además 
el primer miembro permite expresar el logaritmo de cualquier nú- 
mero positivo z, ya que (1 + x)/(1 — x) = z tiene siempre una solu- 
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ción comprendida entre —1 y +1. Así, si queremos calcular log 3, 
hacemos x =1/2 y obtenemos 


1 +12 1 1 1 
MET PETR (rtrt e) 
2 1 
11-21 — 11 264 
lor log 3 = 1,0986, que tiene cinco cifras exactas. 


Con sólo seis términos, hasta el encontramos el va- 


VII. ECUACIONES DIFERENCIALES 





1. Definición.—El papel predominante que las funciones exponen- 
cial y trigonométricas desempeñan en el análisis matemático y en sus 
aplicaciones a la física, radica en que dichas funciones resuelven los 
tipos más sencillos de «ecuaciones diferenciales», 

Una ecuación diferencial relaciona una función desconocida u=f(x) 
con su derivada u’ = f'(x); es una ecuación que contiene u, u’ y ade- 
más, posiblemente, la variable independiente z; p. ej., 


u’ = u + sen (xu) 


u + 3u = r, 
Más en general, una ecuación diferencial puede contener la se- 
gunda derivada u” = f”(x)—e incluso derivadas de orden superior—., 


como, p. ej., 
u” + 2u’ — 3u = 0. 


En cualquier caso, el problema consiste en encontrar una función 
u = f(x) que satisfaga a la ecuación dada. Resolver una ecuación 
diferencial representa una amplia generalización del problema de la 
integración, en el sentido de encontrar la función primitiva de una 
función dada g(x), lo que equivale a resolver la sencilla ecuación di- 
ferencial 
w = g(x). 


Por ejemplo, las soluciones de la ecuación diferencial 


u = gz? 


son las funciones u = 13/3 + c, donde c es una constante arbitraria. 
2. La ecuación diferencial de la función exponencial. La desinte- 
gración radiactiva. La ley del crecimiento. Interés compuesto.—La 


ecuación diferencial 
u=u f1] 
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tiene como solución la función exponencial u = ex, ya que ésta es igual 
a su propia derivada. Con mayor generalidad, la función u = cex, 
donde c es una constante cualquiera, es una solución de [1]. Análo- 
gamente, la función 

u = cekx, 21 


donde c y k son constantes cualesquiera, es una solución de la ecua- 
ción diferencial 
u’ = ku, [3] 


Recíprocamente, cualquier función u = f(x) que satisfaga a la ecua- 
ción [3] debe ser de la forma cexx, Pues si x = h(u) es la función 
inversa de u = f(x), se tiene: 





wat 
=w ka 
logu se paras 
Pero 7 es una función primitiva de 1/ku, de forma que 
log u . 
x = h(u) = + b, siendo b una constante. De donde se deduce que 





k 


log u = kx — bk, 
u = eEx » e-bk, 


Haciendo e-bk (que es una constante) igual a c, se tiene: 
u = ceKx, 


como queríamos demostrar. 

La gran importancia de la ecuación diferencial [3] consiste en que 
gobierna numerosos procesos físicos, en los cuales una cantidad, u, de 
cierta sustancia es una función, u = f(t), del tiempo, f, de tal forma 
que la cantidad u varía en cada instante proporcionalmente al valor 
de u en ese instante. En este caso, la velocidad en el instante t, 


A E a 
ti—t 


es igual a ku, siendo k una constante, positiva si u aumenta y nega- 
tiva si u disminuye. En uno y otro caso, u satisface a la ecuación 
diferencial [3]; por tanto, 


u = cekt, 
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La constante c está determinada si conocemos la cantidad uy que 
existía en el instante £ = 0. Obtendremos dicha cantidad si hace- 
mos £ = 0, 

Uuo = cel = C; 
por tanto, 
u = upekt, [4] 


Obsérvese que suponemos conocida la velocidad de variación de u, 
de donde deducimos la ley [4] que proporciona la cantidad de u exis- 
tente en cualquier instante f. Éste es 
exactamente el problema recíproco de 
hallar la derivada de una función. 

Un ejemplo típico es el de la desin- 
tegración radiactiva. Sea u = [(t) la can- 
tidad de cierta sustancia radiactiva en 
el tiempo t; si suponemos que cada par- 
tícula individual de la sustancia tiene 
Fire. 279. —Decrecimiento expo- "MA determinada probabilidad de desin- 

nencial, u = uoe™, k < 0. tegrarse en un tiempo dado, y que esta 

probabilidad no depende de la presencia 
de las otras partículas, la velocidad a que se desintegra u en un ins- 
tante dado, t, será proporcional a u, es decir, a la cantidad total de 
sustancia existente en ese momento. Por tanto, u satisface a [3] con 
una constante, k, negativa, que mide la velocidad del proceso de desin- 
tegración; esto es, 





u = uget 


Se sigue de ello que la fracción de u que se desintegra en dos inter- 
valos iguales de tiempo es la misma, pues si u es la cantidad que 
existe en el instante t y uz la correspondiente a un instante posterior, 
to, se tiene: 

ua UgpeKtz 


uy Ugekt, 





= ekítet), 


que depende exclusivamente de la diferencia tz — tı. Si deseamos ha- 
llar el tiempo, que debe transcurrir para que se desintegre la mitad 
de la cantidad de sustancia inicialmente dada, deberemos determinar 
s = tg — l, de tal modo que f 
ua 
e = lfa = exs , 
de donde resulta 


ks = log !/2, s = (—log 2)/k, o k = (—log 2)/s. [5] 
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Para cualquier sustancia radiactiva, el valor de s es el semipe- 
ríodo de desintegración; puede determinarse experimentalmente s o 
cualquier otro valor análogo (como, p. ej., el valor de r para el cual 
uz/u; = 999/1000). Para el radio, el semiperíodo vale aproximada- 
mente 1550 años, siendo k = (log 1/2)/1550 = —0,0000447. De aquí 
se deduce que 

u = uge—0,0000447t 

El interés compuesto nos ofrece otro ejemplo de una ley de creci- 
miento que es aproximadamente exponencial. Cierta cantidad de 
dinero, uo pesetas, se coloca al 3 % de interés compuesto, debiendo 
capitalizarse anualmente. Después de un año, el capital más los inte- 
reses será igual a 

u = uo(1 + 0,03); 
al cabo de dos años, 
ug = u (1 + 0,03) = uo(1 + 0,03), 
y transcurridos t años se tendrá 
u, = uo(1 + 0,03). 16] 

Ahora bien: si en lugar de capitalizar por intervalos anuales se 
capitaliza cada mes, o cada n-ésima parte del año, después de f años, 
el capital y los intereses ascenderán a 


0,03 1% 0,03 Y”]* 
uo A = uo e s 


Si n se hace muy grande, de tal modo que el interés se acumula al 
capital cada día o cada hora, al tender n a infinito, la cantidad entre 
corchetes, de acuerdo con VI, tiende a e003, y en el límite, después 
de t años, el capital formado será igual a 

uo © e0,03t, 17] 
que corresponde a un proceso de interés compuesto continuo. Tam- 
bién podemos calcular el tiempo s necesario para que se duplique 
un capital impuesto al 3% anual de interés continuo. Tenemos 
uo * e0,03s 


100 
ES 2, por lo que s = -37 log 2 = 23,10; el capital se du- 
0 


plicará al cabo de 23 años. 

En lugar de proceder por etapas y efectuar después el paso al 
límite, pudimos haber obtenido la fórmula [7] diciendo simplemente 
que la velocidad de crecimiento u’ del capital es proporcional a u, 
con el factor de proporcionalidad k = 0,03, por lo que 

w = ku, (k = 0,03), 
deduciendo entonces la fórmula [7] del resultado general [4]. 
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3. Otros ejemplos. Movimiento vibratorio.—La función exponen- 
cial se presenta a menudo en combinaciones más complicadas; p. ej., 
la función 


u = ex, [8] 


en la que k es una constante positiva, es una solución de la ecuación 
diferencial 
u = —2kxu., 


La función [8] es de importancia fundamental en probabilidades 
y estadística, ya que define la distribución «normal» de frecuencias. 
Las funciones trigonométricas u = cos t, v = sen £, satisfacen tam- 
bién a ecuaciones diferenciales muy sencillas. Se tiene, en primer lugar. 


r 


uw = —sent = —0, 


, 


= COS É = U, 


que es un «sistema de dos ecuaciones diferenciales con dos funciones». 
Derivando nuevamente, se obtiene: 


u” = =v = u, 
v” 


, 
= u = —0, 


por lo que ambas funciones u y v de la variable temporal t pueden 
considerarse como soluciones de la misma ecuación diferencial 


2"4+2=0, 19] 


la cual es una ecuación diferencial sencilla de «segundo orden»; es 
decir, que contiene la derivada segunda de z. Esta ecuación y su 
generalización con una constante positiva k?, 


z” + k?z = 0, [10] 


de la cual son soluciones z = cos kt y z = sen kt, aparecen en el estu- 
dio de las vibraciones. Ésta es la razón por la que las curvas u=sen kt 





F1iG. 280, 


SEC. VII] ECUACIONES DIFERENCIALES 469 





y u = cos kt (Fig. 280) constituyen el fundamento de los mecanismos 
vibratorios. Debe hacerse constar que la ecuación diferencial [10] 
representa el caso ideal de no existir rozamiento o resistencia. Esta 
última se hace intervenir en la 'ecuación diferencial del movimiento 
vibratorio añadiendo otro término rz’, 


z” + rz’ + k?z = 0, (11] 


cuyas soluciones son vibraciones «amortiguadas», que se expresan ma- 
temáticamente mediante las fórmulas 


ra 
errt/2 cos at, e—t/2 sen wt; o= y» — (+) ; 


y se hallan representadas gráficamente en la figura 281. (Como ejer- 
cicio, el lector verificará esas soluciones, llevando a cabo las respecti- 


z 





Fic, 281.— Vibraciones amortiguadas. 


vas derivaciones.) En este caso, las oscilaciones son del mismo tipo 
que las del seno o coseno; pero su intensidad disminuye por efecto del 
factor exponencial, decreciendo más o menos rápidamente de acuer- 
do con la magnitud del coeficiente r, que representa el rozamiento. 

4. Las leyes de la dinámica de Newton.—Aunque exceda a los 
límites señalados a este libro un análisis más detallado de estos hechos, 
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deseamos analizar el aspecto general de los conceptos fundamentales 
mediante los cuales revolucionó Newton la física y la mecánica. Si se 
considera el movimiento de una partícula de masa, m, y coordenadas 
espaciales en función del tiempo, t, x(t), y(t), z(t), las componentes de 
la aceleración serán las derivadas segundas x“(£), y'“(t), z'"(0), y el 
paso verdaderamente importante dado por Newton consistió en com- 
prender que las cantidades mx”, my”, mz”, pueden considerarse como 
las componentes de la fuerza que actúa sobre la partícula. A primera 
vista, esto puede parecer sólo una nueva definición formal del concepto 
de «fuerza» en física. Pero la gran realización de Newton estriba en 
haber formulado su definición de acuerdo con los fenómenos reales de 
la Naturaleza, ya que ésta nos procura a menudo campos de fuerzas 
que nos son conocidos de antemano, sin saber nada acerca del movi- 
miento particular que deseamos estudiar. El mayor triunfo de Newton 
en la dinámica, la justificación de las leyes de Kepler del movimiento 
de los planetas, pone claramente de manifiesto la armonía existente 
entre sus conceptos matemáticos y la Naturaleza. Newton empezó 
por suponer que la atracción de la gravedad es inversamente propor- 
cional al cuadrado de la distancia; si admitimos que el Sol se encuen- 
tra en el origen del sistema de coordenadas y que un planeta dado 
tiene por coordenadas zx, y, z, se deduce que las componentes de la 
fuerza en las direcciones x, Y, z, son iguales, respectivamente, a 
x y Žž 


. k- , 
ko A k-yo 





siendo k una constante gravitatoria independiente del tiempo, y 
r= V q? + y2 + 22, la distancia del Sol al planeta. Estas expresio- 
nes determinan un campo de fuerzas que no depende del movimiento 
de la partícula dentro del mismo. Este conocimiento del campo de 
fuerzas se combina ahora con la ley general de la dinámica de Newton 
(es decir, con la expresión de la fuerza en función del movimiento); 
igualando ambas expresiones, se tiene: 


ES —kzx 
E TS 
LA ZAY 
my = (12 + y? + 2P? 
—kz 
mz” = 


CET ETO 


sistema de tres ecuaciones diferenciales con tres funciones desconoci- 
das z(t), y(t), z(t). Este sistema puede resolverse y resulta, de acuerdo 
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con las observaciones empíricas de Kepler, que la órbita del planeta 
es una cónica en uno de cuyos focos se encuentra el Sol, deduciéndose 
además que las áreas barridas por el radio vector que une el Sol con 
el planeta son iguales para tiempos iguales, y que los cuadrados de 
los períodos de una revolución completa de dos planetas son propor- 
cionales a los cubos de sus distancias al Sol. Omitimos las correspon- 
dientes demostraciones. 

El problema de las vibraciones nos procura un ejemplo más ele- 
mental del método de Newton. Supongamos que tenemos una par- 
tícula que se mueve a lo largo de una recta, el eje de las x, y que está 
unida al origen por una fuerza elástica tal como un resorte o una 
tira de caucho. Si se aparta la partícula de su posición de equilibrio 
en el origen hasta llevarla a una posición dada por su coordenada zx, 
la fuerza la hará retroceder con una intensidad que supondremos pro- 
porcional a la elongación x; puesto que la fuerza está dirigida hacia el 
origen, vendrá representada por —k?x, siendo —k2 un factor nega- 
tivo de proporcionalidad, que expresa la fuerza del resorte o de la 
tira de caucho. Supondremos además que existe rozamiento, el cual 
retarda el movimiento, y que éste es proporcional a la velocidad z’ 
de la partícula, con otro factor de. proporcionalidad —r. Entonces, la 
fuerza total en un instante cualquiera será —k?x — rr’, y, de acuerdo 
con el principio general de Newton, encontramos que mz” = —k?r—rz'; 
o sea, 

ma” + rxz + k?z = 0. 


Ésta es precisamente la ecuación diferencial [11] de las vibraciones 
amortiguadas que ya hemos mencionado. 

Este sencillo ejemplo es de gran importancia, puesto que numero- 
sas clases de sistemas vibrantes, mecánicos y eléctricos, pueden des- 
cribirse matemáticamente mediante dicha ecuación diferencial. He 
aqui, pues, un ejemplo tipico, en el que una formulación matemática 
abstracta pone simultáneamente al descubierto la íntima estructura 
de muchos fenómenos, aparentemente distintos e inconexos. Esta 
abstracción, que, partiendo de la naturaleza particular de un fenóme- 
no dado, llega hasta la formulación de la ley general que gobierna 
toda una clase de ellos, es uno de los rasgos característicos del trata- 
miento matemático de los fenómenos físicos. 


SUPLEMENTO AL CAPÍTULO VII 


I. CUESTIONES DE PRINCIPIO 


1. Derivabilidad.—Hemos establecido una conexión entre el con- 
cepto de derivada de una función y =f (x) y la idea intuitiva de 
tangente a la gráfica de la función. Puesto que el concepto general 
de función es tan amplio, se hace necesario, en interés de la perfección 
lógica, prescindir de esa dependencia de la intuición geométrica, pues 
no tenemos ninguna seguridad de que los hechos intuitivos familiares, 
que resultan de la consideración de las curvas más sencillas, tales 
como circunferencias o elipses, subsistan necesariamente en las gráfi- 
cas de funciones más complicadas. Consideremos, p. ej., la función de 


y 
y Y 
T 2 a 
0 0 0 
Fic. 282.—y =x+>I|xl. FIG. 283.—y = |x|. FrG. 284.—y =x+|x1+ 


+ (1-1) + |2-1!. 


la figura 282, cuya gráfica tiene un punto anguloso. Esta función 
viene definida por la ecuación y = x + |x], en la cual |x| es el 
valor absoluto de x; es decir, 


y=t+x=2x0 para x>0, 
y=x-—x=0 para x<o0. 


Otro ejemplo lo proporciona la función y = | x |; otro más lo tene- 
mos en la función siguiente: y = x + |x] + (Œ — 1) +|x— 1|. Las 
gráficas de estas funciones carecen en ciertos puntos de tangente 
definida, o de dirección, lo que significa que las funciones no poseen 
derivadas para los correspondientes valores de x. 


Ejercicios: 
1. Fórmese la función f(x) cuya gráfica es la mitad de un hexágono regular. 
2. ¿Dónde se encuentran los puntos angulosos de la gráfica de 


Kæ) = (+ |x |) + 1/2 { (@—3/2) + | 212) 3 + 1/4 { (1-0) + | 2-4 1}? 
¿Cuáles son las discontinuidades de f'(x)? 


472 
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Otro ejemplo sencillo de no derivabilidad nos lo procura la fun- 
ción siguiente: 


1 
y = f(x) = xsen-—, 
fA Xx 


que se obtiene de la función sen 1/x (véase pág. 294) multiplican- 
do por el factor x. Definimos f(x) como igual a cero para x = Q. 
Esta función, cuya gráfica para 
valores positivos de x aparece en 
la figura 285, es continua en todo 
punto. La gráfica oscila infinitas 
veces en el entorno de gx = Q, 
haciéndose muy pequeñas las «on- 
das» al acercarse a ese punto. La 
pendiente de estas ondas está 
dada por 


1 
(1) = sen — — — cos -— 
Pp) z x x 0 


(lo que el lector puede verificar 
como ejercicio); cuando x tiende a 
cero, esta pendiente oscila entre 
límites constantemente crecientes, 
positivos y negativos. Para x = 0, 
podemos intentar la determinación 
de la derivada como límite para 


Ñ E FiG, 285. —y = x sen L 
h — 0 del cociente de incrementos 


h sen 
HO +10) __ h 1 
h h 


Pero al tender h a cero, este cociente oscila entre —1 y +1, sin ten- 
der a ningún límite, por lo que la función carece de derivada para 1=0, 

Estos ejemplos acusan la existencia de una dificultad intrínseca. 
Weierstrass ilustró de forma sorprendente esta situación construyendo 
una función continua cuya gráfica carece de tangente en todos sus 
puntos. En tanto que la derivabilidad implica la continuidad, estos 
ejemplos prueban que la continuidad no entraña la derivabilidad, 
puesto que la función de Weierstrass es continua y no tiene derivada 
en ninguno de sus puntos. En la práctica, esas dificultades no apare- 
cen; excepto, tal vez, en puntos aislados, las curvas son tales que no 
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sólo es posible derivarlas, sino que además la derivada es continua. 
Entonces, ¿por qué no habríamos de prescribir la ausencia de estos fe- 
nómenos «patológicos» en los problemas que hemos de considerar? Esto 
es exactamente lo que se hace en el cálculo, donde sólo se consideran 
las funciones derivables. En el capítulo VIII hemos derivado muchos 
tipos de funciones, con lo que quedó demostrada su derivabilidad. 
Puesto que la existencia de derivada de una función no es una 
consecuencia lógica del primer concepto, deberá demostrarse o supo- 
nerse, El concepto de tangente o de dirección de una curva, que 
constituyó originalmente la base del concepto de derivada, se deduce 
entonces de la pura definición analítica de esta última. Si la fun- 
ción y = f(x) tiene derivada; es decir, si el cociente de incrementos 
fía + 1) —K(0) 
h 
uno u otro lado, se dice que la curva correspondiente tiene una tan- 
gente con pendiente f'(x). Queda así invertida la actitud ingenua de 
Fermat, Newton y Leibniz, en interés de la compatibilidad lógica. 


tiene límite único f'(x), cuando h tiende a cero por 


Ejercicios: 
1. Demuéstrese que la función continua definida por x? sen (1/2) tiene deri- 


vada en r = 0. 
2. Demuéstrese que la función arc tg (1/x) es discontinua para x = 0; que 
x arc tg (1/x) es continua, pero carece de derivada en x = 0, y que x? arc tg (1/x) 


tiene derivada para x = 0. 


2. La integral.—La situación es completamente análoga respecto 
a la integral de una función continua f(x). En lugar de considerar el 
«área situada debajo de la curva» y = f(x) como una cantidad que 
existe con toda evidencia y que puede expresarse a posteriori como 
límite de una suma, definimos la integral mediante este límite y consi- 
deramos el concepto de integral como la base fundamental a partir de 
la cual se deduce después el concepto general de área. Nos vemos 
obligados a proceder así debido a la vaguedad de la intuición geomé- 
trica cuando se aplica a conceptos analíticos tan generales como el 
de función continua. Comencemos formando la suma: 


Sn => Hoy) (2) — 251) => f(05) Az, 1} 
j=1 


j=1 
siendo £o = 4, %1, ..., n = b, una subdivisión del intervalo de inte- 
gración; Ar; = zj — xj, es el incremento de zv, o longitud del inter- 
valo de lugar j, y v) un valor arbitrario de x en este subintervalo; 
es decir, 1311 < vj < q; (p. ej., podemos tomar v; = Tj 0 Vj = Tj-1). 
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Formemos ahora una sucesión de tales sumas, de forma que el nú- 
mero n de subintervalos aumente y al mismo tiempo tienda a cero la 
máxima amplitud de los mismos. El hecho fundamental es éste: la 
suma Sy, para una función continua dada, f(x), tiende a un límite 
definido, A, que es independiente de la particular elección de los 
subintervalos y de los puntos vj. Por definición, este límite es la in- 


b 
tegral A =f Had. 


Naturalmente, la existencia de este límite requiere una demostra- 
ción analítica, si deseamos independizarnos de la noción geométrica 
intuitiva de área. Esta demostración puede consultarse en cualquier 
tratado riguroso de cálculo integral. 

Al comparar los procesos de derivación e integración nos enfren- 
tamos con la siguiente y contradictoria situación: la derivabilidad es, 
sin ninguna duda, una condición restrictiva respecto al concepto de 
función continua, pero la ejecución del proceso de derivación, esto 
es, el algoritmo del cálculo diferencial, es en la práctica un procedi- 
miento directo basado en unas cuantas reglas sencillas. Por el con- 
trario, toda función continua, sin excepción alguna, es integrable 
entre dos límites dados cualesquiera, y, en cambio, la formulación 
explícita de tales integrales, aun para las funciones más sencillas, es 
en general una tarea muy ardua. Por ello, en muchos casos, el teorema 
fundamental del cálculo integral constituye el instrumento decisivo 
para llevar a cabo la integración; sin embargo, para la mayoría de 
las funciones, aun para las más elementales, la integración no conduce 
a expresiones explícitas sencillas, y el cálculo numérico de las inte- 
grales requiere el uso de métodos menos elementales. 

3. Otras aplicaciones del concepto de integral. Trabajo. Rectifica- 
ción.—Al disociar la noción analítica de integral de su interpretación 
geométrica original nos encontramos con otras muchas interpretacio- 
nes y aplicaciones igualmente importantes; p. ej., la integral puede 
interpretarse en mecánica como expresión del concepto de trabajo, 
bastando para nuestro objeto la exposición del caso siguiente, elegido 
entre los más elementales: supongamos una masa en movimiento a 
lo largo del eje x bajo el influjo de una fuerza dirigida a lo largo del 
mismo. La masa se supone concentrada en el punto de abscisa x y la 
fuerza viene dada como una función f(x) de la posición, indicándose 
con el signo de f(x) si está dirigida en la dirección positiva o negativa 
del eje. Si la fuerza es constante y desplaza la masa desde el punto 
a al b, el trabajo realizado es igual al producto (b — a)f de la intensi- 
dad f de la fuerza por la distancia recorrida por la masa; pero si la 
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intensidad varía con x, nos vemos precisados a definir la cantidad de 
trabajo realizado por un proceso de límite (como hicimos para definir 
la velocidad). A este objeto, dividimos el intervalo de extremos a y b 
en subintervalos menores, mediante los puntos to = 4, £i, ..., n= b; 
a continuación suponemos que en cada subintervalo la fuerza se man- 
tiene constante e igual, p. ej., a f(x,), que es su verdadero valor en 
el extremo del mismo, y después calculamos el trabajo que corres- 
pondería a esta fuerza que varía por saltos: 


Si, como antes, hacemos ahora más fina la subdivisión, de manera que 
n tienda a infinito, vemos que la suma anterior tiende a la integral 


'b 
| f(£) dx. 


De esta manera el trabajo realizado por una fuerza continuamente 
variable se define por medio de una integral. 

Como nuevo ejemplo vamos a considerar una masa m sujeta por 
un muelle elástico al origen x = 0; de acuerdo con lo dicho en la 
página 471, la fuerza f(x) será proporcional a x: 


Ha) = —kex, 


donde k? es una constante positiva. El trabajo realizado por dicha fuer- 
za cuando la masa se desplaza desde el origen a la posición x = b será: 


b b2 
2x d k2 
Ta e z’ 








y el trabajo que debemos hacer contra tal fuerza para llevar el ex- 
b2 
tremo del resorte a esta posición es + k? 3” 


Una segunda aplicación del concepto general de integral es la 
noción de longitud de un arco de curva. Supongamos que la porción de 
la curva que se considera está representada por una función y = f(x), 


d 
cuya derivada f'(x) = E es también una función continua. Para 


definir su longitud procederemos en igual forma que si tuviéramos 
que medir la curva para algún fin práctico utilizando una vara de 
medir rígida. Inscribimos en el arco AB una poligonal de n lados 
convenientemente pequeños, y consideramos la longitud total Ln de 
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esta poligonal como una primera aproximación; si hacemos aumentar 
n al propio tiempo que tiende a cero la máxima longitud de los lados 


de la poligonal, definimos 
i L = lím Ln 


como la longitud del arco AB. (En el capítulo VI obtuvimos la longi- 
tud de una circunferencia de esta misma forma, como límite de los 
perímetros de polígonos regulares inscritos.) Puede demostrarse que 
para curvas no muy arbitrarias este límite existe y es independiente 
de la particular manera de elegir la sucesión de poligonales inscritas; 
estas curvas se dice que son rectificables. Cualquier curva «razonable» 
de las que aparecen en la teoría o en las aplicaciones será siempre 
rectificable y no hemos de preocu- 


parnos de investigar los casos pa- 
tológicos. Nos contentaremos con PAN 
demostrar que todo arco AB, co- 


rrespondiente a una función y=f(x) 

con derivada continua f'(x), es rec- 

tificable en el sentido dicho, y que ` 

su longitud L puede expresarse 

por una integral. S 
A este fin, representemos las Y Ze 

abscisas de A y B por a y b, res- Fte. 286. — Longitud de un arco de curva. 

pectivamente; subdividamos el in- 

tervalo (a, b) mediante los puntos x = a, Xi, ..., Ejs -s Zn = b, y con- 

sideremos la poligonal de vértices zj, y; = f(x) situados directamente 

por encima de estos puntos de subdivisión. La longitud de un lado 

cualquiera de la poligonal será 4/ (zj — 23-12 + (y, — Yj- = 

= y i F Ay? = am )/1+ (42 z 

mo longitud total de la poligonal 


2 
Ln 2 y: + (=) Ax;j. 
Si hacemos ahora tender n a infinito, los cocientes de incrementos 
e tenderán a la derivada “2 = f'(x) y obtenemos, como expresión 
de la longitud L, la integral 


. En consecuencia, tendremos co- 


b 
L= f VI F FO dr. (2] 


COURANT. —17 
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Sin entrar en más detalles de esta discusión teórica, vamos a ter- 
minar con dos notas suplementarias. Primera, si se considera que B 
es un punto variable de abscisa x sobre la curva, entonces L = L(x) 
se transforma en una función de x, y tenemos por el teorema fun- 
damental 


dL A 
L'a) = 3 = VI+ OI? 


fórmula de uso muy frecuente. Segunda, en tanto que la fórmula [2] 
da la solución «general» del problema, sólo procura una expresión 
explícita de la longitud del arco en casos particulares. Para esto ten- 
dremos que sustituir la función concreta f(x), o mejor dicho, f'(x), 
en [2] y a continuación realizar la integración efectiva de la expresión 
así obtenida, lo que entraña en general dificultades insuperables si 
nos restringimos a no hacer uso de otras funciones que las elementales, 
únicas consideradas en esta obra. Vamos a mencionar algunos casos 
en los que la integración es posible. La función 


y =1(1) = V1-2 





d 
representa la circunferencia unidad, y tenemos f(x) = =— = 
Sy a TI FM — 1 
ri V1+f(1)? = Ha de modo que la lon 


gitud de un arco de circunferencia está expresada por la integral 





E dx R 
“— == = arc sen 0 — arc sen q. 
A vi — a 


Para la parábola y = 2?, se tiene f'(x) = 2x, de donde la longitud del 
arco entre x = 0 y x = b será: 


b 
f V1 + 422 dx. 
o 


Para la curva y = log sen x, tenemos f'(1) = cot x, y la longitud 
del arco viene expresada por 


b 
f Vi + cot? zx dx. 
a 


Nos contentaremos con escribir estas expresiones integrales, las 
cuales podrían ser calculadas disponiendo de algún recurso más de los 
que tenemos a mano, pero no deseamos ir más lejos por este camino. 
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11. ÓRDENES DE INFINITUD 


1. La función exponencial y las potencias de «x».—Encontramos 
con frecuencia en matemáticas sucesiones An que tienden a infinito, 
y a menudo se precisa comparar una de tales sucesiones con otra bn, 
también divergente, pero quizá «más rápidamente» que lo es an. Para 
precisar este concepto, diremos que bn tiende a infinito con mayor 
rapidez que an, o que es de mayor orden de infinitud que an, si la razón 
an/0n (en la cual tanto el numerador como el denominador tienden 
a infinito) tiende a cero al crecer n. Así, p. ej., la sucesión bn=n? 
tiende a infinito más rápidamente que la sucesión an=n, y esta últi- 
ma a su vez lo hace con mayor rapidez que la cn = y/n; en efecto: 

An n 1 Cn Vn 1 


ada ir EDO a n far 
Es evidente que ns tiende a infinito más rápidamente que nr siem- 
pre que s >r > 0, ya que n/n = 1/nts-n > 0. 

Si el cociente An/by tiende a un límite constante c, distinto de cero, 
diremos que las dos sucesiones an y bn tienden a infinito con la misma 
rapidez, o que tienen el mismo orden de infinitud. Así, an = n? y 
bn = 2n2 + n tienen el mismo orden de infinitud, dado que 

an n? 1 1 
ba ny A 
n 

Cabría pensar que utilizando las distintas potencias de n como 
patrones podrían medirse los distintos órdenes de infinitud de las 
diferentes sucesiones divergentes, &n. Para ello habría que determinar 
una potencia conveniente ns del mismo orden de infinitud que an; es 
decir, tal que an/n* tendiera a una constante finita distinta de cero. 
Resulta notable el hecho de que esto no sea posible en todos los casos, 
pues la función exponencial an con a > 1 (p. ej., en) tiende a infinito 
más de prisa que cualquier potencia n8, por muy grande que se elija s, 
en tanto que log n tiende a infinito más despacio que cualquier poten- 
cia ns, por pequeño que sea el exponente positivo s. En otras palabras, 
se tienen las relaciones 

ns 
O 1] 


an 


log n 


>0 12] 
ns 
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para n tendiendo a infinito. Por supuesto que el exponente s no pre- 
cisa ser entero, sino que puede ser cualquier número positivo fijo. 

Para demostrar [1] simplificaremos en primer lugar el enunciado, 
considerando la raíz de índice s de dicho cociente, pues si esta raiz 
tiende a cero, lo mismo ocurrirá con el cociente dado. Por consiguiente, 
nos basta comprobar que 


n 





anis 


al tender n a infinito. Sea b = al!s; como se ha supuesto que a es 
mayor que 1, b y, por tanto, también yb = b1/? serán mayores que 1. 
Podemos escribir: 

b2 = 1 +q, 


siendo q positivo. Si tenemos ahora en cuenta la desigualdad [6] dada 
en la página 22, tendremos: 


bni = (1 +g)" > 1 + ng > ng, 
de modo que 
aris = þa > ng? 
y 
n n 1 
ama < gE T gE 


Con lo que la demostración queda efectuada, pues el segundo miem- 
bro de la última igualdad tiende a cero al tender n a infinito. 
La relación 
xs 

subsiste evidentemente si x tiende a infinito siguiendo los valores de 
una sucesión divergente cualquiera xı, x2, ..., que no precisa coinci- 
dir con la sucesión de los números naturales 1, 2, 3, ... En efecto, si 
n=—1<x<mn, se tiene: 


as ns në 





Puede hacerse uso de esta observación para establecer [2]. Si es- 
cribimos x = log n y es = a, de forma que n = e*¥ y ns = (es), el 
cociente que figura en [2] se transforma en 


T 


ax 


, 


que es un caso especial de [3] para s = 1. 
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Ejercicios: 

1. Demuéstrese que, para x —> co, la función log log x tiende a infinito más 
despacio que log x. 

2. La derivada de x/log x es 1/log x — 1/(l0g x)?. Demuéstrese que, para va- 
lores grandes de x, es «asintóticamente» equivalente a su primer término, 1/log q; 
es decir, que su cociente tiende a 1 cuando r> oo. 


2. Orden de infinitud de log (n!).—En muchas aplicaciones, 
p. ej. en la teoría de las probabilidades, es importante conocer el 
orden de infinitud o «comportamiento» asintótico de n! para valores 
grandes de n. Nos conformaremos aquí con estudiar el logaritmo de 
nl; esto es, la expresión 


Pa = log 2 + log 3 + log4 + ::* + logn. 


Vamos a demostrar que el «valor asintótico» de Pņ es igual a n log n; 
es decir, que 
log (n!) 
nlogn. 


> 


cuando n —> œ. 
La demostración es un ejemplo típico de un método muy utili- 
zado de comparar una suma con una integral. En la figura 287 la 


y 





12 nl n nel 
FiG. 287. — Cálculo aproximado de log (n!). 


expresión Pn es igual a la suma de las áreas de los rectángulos tra- 
zados con línea llena, y que en su conjunto no exceden al área 


n+l 
Í log z dx = (n + 1) log (n + 1)—(n+1)+1 
1 


comprendida por la curva logaritmica desde 1 a n + 1 (véase pági- 
na 461, Ejercicio 1). Pero la suma Pp es también igual al área total 
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de los rectángulos que tienen parte de su contorno de trazos, y que 
en su conjunto superan al área situada bajo la curva entre 1 y n, la 
cual es igual a 


fa 
| log x dx = nlogn ~ n +1. 
1 


Tenemos así 
nlogn—n+1=< P< (n +1)log(n + 1)—n, 
y dividiendo por n log n, 


1 1 Pa log (n + 1) 1 
< (+ tn) log n logn E 











logn alga © nlogn 


log n + log (1 + 1/n) 1 
log n T log n 








= (1 + 1/1) 


Evidentemente, ambas acotaciones tienden a 1 al tender n a infinito, 
con lo cual queda demostrado lo que deseábamos. 


Ejercicio. — Demuéstrese que ambas acotaciones son mayores que 1 — 1/n y 
menores que 1 + 1/n, respectivamente. 


HI. SERIES Y PRODUCTOS INFINITOS 


1. Series funcionales.—Como ya hemos dicho, expresar un número 
s mediante una serie 
s= bi + ba + batt [1] 


no es otra cosa que un simbolismo adecuado para expresar el hecho 
de que s es el límite, al tender n a infinito, de la sucesión de «sumas 
parciales» 
S1, $2, $3, ***, 
donde 
Sn = bi + b2 + te +0. [2] 


En consecuencia, la ecuación [1] equivale a la igualdad limite 
lím Sn =s cuando n>, [3] 


en la cual sn está definida por [2]. Cuando existe el limite [3] deci- 
mos que la serie [1] converge hacia el valor s, mientras que si el limi- 
te [3] no existe, diremos que la serie diverge. 

Por ejemplo, la serie 


1 — Hs + Ys ~h +: 
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converge hacia el valor 1/4, y la serie 


a Y Y A 


converge hacia el valor log 2; por otra parte, la serie 
l-1+1-1++*.* 


es divergente (ya que sus sumas parciales toman alternativamente 
los valores 1 y 0), y la serie 


1+14+141+--.. 


diverge, por tender a infinito la sucesión de sus sumas parciales, 
Nos hemos encontrado ya con series cuyos términos b; son fun- 


ciones de x de la forma 
bi = cxi, 


siendo constantes los coeficientes ci. Dichas series se llaman series 
potenciales, y son límites de los polinomios que representan sus sumas 


parciales 
Sp = Co + CT + cst? + ++ + Coa? 


(la adición del término constante co sólo requiere un pequeño cambio 
en la notación [2]). Un desarrollo 


f(x) = co + cit + ear? + + >> 


de la función f(x) en serie de potencias constituye así una forma de 
expresar aproximadamente f(x) por medio de polinomios, que son las 
funciones más sencillas. Podemos resumir, completándolos, los resul- 
tados anteriores, escribiendo la sucesión siguiente de desarrollos en 
serie de potencias: 


1 





=1-rt+42- B+, válido para —1 < 1< +1 [4] 
l+x 
a x$ 
arc tgz =2- 3 bg» válido para —1 <z < +1 [5] 
zì xs 
log (1 +2) =z- 7 tgo válido para —1<r<w+1 [6] 
l+x x3 x’ 
rd dd tg t. válido para —1 < r< +1 [7] 


x? x3 rå 
a=1+r+ +3 ++ o válido para todo z. [8] 
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A la relación anterior podemos añadir aún los importantes desarro- 
llos siguientes: 





as añ 

sen r = t — 3 + 51 E válido para todo x; 19] 
x? xi 

cos x=1-— an TT AA válido para todo x. 110] 


La demostración es una consecuencia inmediata de las fórmulas (véase 
pág. 450) 


x 
| sen u du = 1 — cos x, fa] 
Jo 


f cos u du = sen X. [b] 
0 

Si partimos de la desigualdad cos x < 1 y la integramos entre 0 y zx, 
siendo x un número positivo dado, obtenemos (véase fórmula [13], 
pág. 423): 


sen £ < 12; 
integrando de nuevo, 
a? 
1 — cos qx E 
< 2 
o lo que es equivalente, 
zx? 
cosx > i— > 


Si volvemos a integrar, obtenemos: 


x3 x3 
sengs >r — p3 =T 31 
Procediendo indefinidamente en igual forma, resultan las dos colum- 


nas de desigualdades 





sent <r cosx <1 
x? 
senz >£ -yy cost > 1— -zy 
as ad q? xi 
sen z < t — -y tgr coss <1 — -zy + 
ad ad a? x2 xå xê 
sent >u 31 +5 71 coss > 1 — tar 


Ahora bien: <%/n! —> 0 al tender n a infinito; para probarlo, elijamos 
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un entero m tal que x/m < 1/2, y escribamos c = 2M/m!; para cual- 
quier entero n > m (p. ej., n =m + r) se tiene: 
x T zr 


z 
Lgr ` cs 1 
0<- E m+1 m+2 ma Cl 





y cuando n > 00, también r —> œo y, por tanto, c(1/2)r > 0, En re- 
sumen, 


as x5 x? 
sen x=" — 5 + TA + 
i x? xi xê 
die ka O 


Por ser los términos de la serie alternativamente positivos y negativos 
y decrecientes (al menos para | x | < 1), resulta que el error cometido 
al interrumpir la serie en un término cualquiera es inferior al valor 
absoluto del primer término despreciado. 

OBSERVACIONES: Estas series pueden utilizarse para el cálculo de 
tablas de líneas trigonométricas. Ejemplo: ¿Qué valor tiene sen 10? 
La medida en radianes de 1% es x/180, y, en consecuencia, 


T T 1 z Y? 
seno 7180 Te Viso) + 
El error cometido al prescindir de los términos siguientes es inferior 


1 z y5 
ao (535) , que a su vez es menor que 0,00000000002. Por 


tanto, sen 19 = 0,0174524064, con diez cifras decimales exactas. 
Para terminar, mencionaremos sin demostración la «serie binómica» 


(1428 = 1 + axr + C3? + Cb cc, 111] 
en la cual Cf es el «coeficiente binómico» 


coa ala — 1) (a — 2) -+ (a — s + 1) 
s. s! 


Si a = n es un entero positivo, CÌ = 1, y para s > n todos los coefi- 
cientes Cf de [11] son nulos. En este caso, la serie se reduce a la cono- 
cida fórmula del binomio. Fué una de las grandes aportaciones de 
Newton, realizada al comienzo de su carrera, el darse cuenta de que 
la fórmula elemental del binomio podía generalizarse para expórien- 
tes arbitrarios, positivos o negativos, racionales o irracionales. Cuan- 
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do a no es entero, el segundo miembro de [11] da lugar a una serie, 
válida para —1 < x < +1. Para |x| > 1, la serie [11] es divergente 
y la igualdad pierde su significado. 
En particular, si sustituímos a por1/2 en [11], obtenemos el desarrollo 
=== 1 1-3 1:3-5 
Viti=1+ ix 2 a Los == a+... [12] 


Al igual que otros matemáticos del siglo xv111, Newton no dió una 
demostración satisfactoria de la validez de su fórmula. El análisis 
adecuado de la convergencia y del intervalo de validez de este tipo 
de series no se hizo hasta el siglo xIx. 





Ejercicio: Escríbanse las series de potencias de Vi -r y 1/V1 —Í. 


Los desarrollos [4] a [11] son casos especiales de la fórmula gene- 
ral de Brook Taylor (1685-1731), por la cual se consigue desarrollar 
una amplia clase de funciones f(x) en forma de serie potencial 


HA) = Co + cix + cx? + eax? +>, 113] 


determinando una ley que expresa los coeficientes ci por medio de 
la función f y sus sucesivas derivadas. No es posible en este lugar 
detenernos a dar una demostración rigurosa de la fórmula de Taylor, 
formulando y estableciendo las condiciones requeridas para su validez. 
Nos limitaremos a algunas consideraciones que aclaran ciertas. rela- 
ciones existentes entre importantes hechos matemáticos. 

Para comenzar, supongamos posible el desarrollo [13], y admita- 
mos además que f(x) puede ser reiteradamente derivada, asegurán- 
donos la existencia de la sucesión indefinida de derivadas 


MO, fa, e: Wo), --> 


Finalmente, admitiremos también que una serie de potencias puede 
derivarse término a término en la misma forma que un polinomio. 
Con estas hipótesis, podemos determinar los coeficientes cn a partir 
del conocimiento de la forma de comportarse f(x) en el entorno de 
x = 0. Sustituyendo x = 0 en [13] encontramos 


co = f(0), 


por anularse todos los términos de la serie que contienen x. Si ahora 
derivamos [13], resulta: 


(e) = c1 + 2cgx + 3ega? + +++ + Nearly +... [137] 
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Sustituyendo nuevamente x = 0, pero esta vez en [13] y no en [13], 
obtenemos: 
cı = f(0). 


Por derivación de [13] resulta: 
f(x) = 23 + 2: 3 > esx + cc:.+(n—1):R > Caza- + +e; [137] 
la cual, después de hacer x = 0, nos da 
21 c3 = f”(0). 
De forma análoga, si se deriva [13”}] y se hace x = 0, 
3! cs = (40), 


y continuando este proceso, llegamos a la fórmula general 
g in) (0 
Cn PES ( ) 


en la cual [tm (0) es el valor de la derivada n-ésima de f(x) para r=0. 
Obtenemos así la serie de Taylor 


x? a 
Ha) = KO) + zO +57 M0) + Gp 10) + **> [14] 


Como ejercicio de derivación puede comprobar el lector que en los 
ejemplos [4] a [11] se satisface la ley de formación de los coeficientes 
que corresponde a la fórmula de Taylor. 

2. Fórmula de Euler: cos x + i sen x = elX.—Uno de los resul- 
tados más fascinantes de las manipulaciones formalistas de Euler es 
la relación íntima existente en el campo complejo entre las funciones 
seno y coseno, de un lado, y la exponencial, por otro. Debe advertirse 
de antemano que la «demostración» de Euler y nuestra subsiguiente 
argumentación carecen del rigor necesario, y sólo constituyen ejem- 
plos típicos de las manipulaciones formales del siglo xviii. 

Comencemos con la fórmula de De Moivre establecida en el ca- 
pítulo IT: 

(cos nọ + i sen np) = (cos y + i sen q), 


Si en ésta hacemos la sustitución p = x/n, obtenemos la fórmula 


z x Y” 
(cos x + ¿sen 1) = (2 + isen 2) 
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. Tt e . 1 
Si suponemos dado x, cos a diferirá muy poco de cos 0 = 1 para 


valores grandes de n. Además, ya que 


x 
sen — 





x 
—> 1 cuando —>0 
n 


n 
7 1 Y a: 24: : xt 
(véase pág. 318), vemos que sen mws asintóticamente igual a > por 


lo que resulta justificado escribir la fórmula límite 
ix \” 
cos x + isen x = lím (: + 2) cuando n —> œ. [14] 


Al comparar el segundo miembro de esta igualdad con la relación 
(pág. 459) 


n 
z 
ez = lím (: + Z) cuando n > œ, 


obtenemos: 
cos x -+ isen x = eix, [15] 
que constituye la fórmula de Euler. 
Se puede llegar al mismo resultado por otro camino formal par- 
tiendo del desarrollo de ez: 
z2 z3 


z 
AA t 





y haciendo en él z = ix, donde x es un número real. Si recordamos 
que las sucesivas potencias de i son i, —1, —i, 1, y así periódica- 
mente, separando las partes real e imaginaria encontramos: 


x? xt xs , ae añ x7 

de (: a ta erT =) pies (- ~ata at c), 
que, comparada con los segundos miembros de las series de sen x y 
cos x, nos da nuevamente la fórmula de Euler. 

Esta forma de razonar no constituye en absoluto una demostra- 
ción de la relación [15]. La objeción que cabe hacer a nuestra segunda 
argumentación es que el desarrollo en serie de ez fué deducido en la 
hipótesis de que z era real, por lo que requiere una justificación la 
sustitución z = ix. De forma análoga, la validez de la primera argu- 
mentación queda destruida por el hecho de que la fórmula 








ez = lím (1 +2z/nj cuando n-—=>o0 


fué obtenida en la hipótesis de ser z real. 
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Para liberar a la fórmula de Euler de la esfera del mero forma- 
lismo y darle una justificación rigurosa, conforme requiere toda ver- 
dad matemática, se precisa de los resultados de la teoría de funciones 
de variable compleja, una de las mayores realizaciones matemáticas 
del siglo xix, y cuyo desarrollo fué también estimulado por otros 
muchos problemas. Hemos visto, p. ej., que los desarrollos de las 
funciones en serie de potencias convergen para intervalos de x dife- 
rentes, y cabe preguntarse por qué algunos de estos desarrollos con- 
vergen siempre, es decir, para todo x, en tanto que otros carecen de 
significado para |x| > 1. 

Consideremos como ejemplo la serie geométrica [4] (pág. 483) que 
converge para |x| < 1. El primer miembro de esta igualdad tiene 

1 1 
e aS 
tanto que la serie que figura en el segundo miembro se comporta de 
forma bastante más extraña, transformándose en 


perfecto significado para x = 1, tomando el valor 





l-1+1=1++-* 


Esta serie no converge, ya que sus sumas parciales oscilan entre 1 y 0; 
todo lo cual indica la existencia de funciones que pueden dar lugar 
a series (divergentes) aunque por sí mismas no presenten ninguna 





irregularidad. Por supuesto que la función La tiende a infinito 


cuando x > —1. Según puede demostrarse fácilmente, la convergen- 
cia de una serie potencial para xr = a > 0 supone siempre la conver- 
gencia para —a <x <a, de lo cual cabe deducir una «explica- 
ción» de la extraña conducta del desarrollo en z = —1, punto de 





En cambio, la función 


, AEIR 1 
discontinuidad de TF 142 





se desarro- 


lla en la serie 
1 

— =1- zr? — x8 ... 

im 1 — x? + rê — x? 4 
sin más que sustituir x por z? en [4]. Esta serie converge también 
para |x| < 1, mientras que para x = 1 da otra vez lugar a la serie 
divergente 1 — 1 + 1 — 1 + 1... y para |x| > 1 diverge explosiva- 
mente, aunque la propia función es regular en todo punto. 

Resulta que una explicación completa de tales fenómenos única- 

mente es posible cuando las funciones se estudian no sólo para valo- 
res reales, sino también complejos, de la variable x; p. ej., la serie 
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1 
correspondiente a IFz debe divergir para x = i a causa de que 
el denominador de la fracción se anula para dicho valor, y resulta que 
también debe divergir para todo x tal que |x] >|i|=1, porque, 


según puede demostrarse, la convergencia para uno de tales valores 
de x supondría la convergencia para x = i. Así el problema de la 
convergencia de las series, que fué completamente olvidado en lą 
primera época del desarrollo del cálculo, se transformó en uno de los 
factores principales que contribuyeron a la creación de la teoría de 
funciones de variable compleja. 

3. La serie armónica y la función Z. Producto de Euler.—-Resultan 
particularmente interesantes algunas series cuyos términos son com- 
binaciones sencillas de los números enteros; entre éstas vamos a con- 
siderar la «serie armónica» 


y 1 1 1 1 16 
le tz tyt PT , [16] 


que difiere de la correspondiente a log 2 en los signos de los términos 
pares. 
La convergencia de la serie depende de si la sucesión 


S1, S2, $3, ***, 
en la cual 
=1 EN Ls ... des [17] 
A A 


tiende a un límite finito. Aunque los términos de la serie [16] tien- 
den a 0, es fácil ver que la serie no converge; en efecto, vamos a de- 
mostrar que si tomamos un número suficiente de términos su suma 
llega a exceder a cualquier número positivo, de forma que sp crece 
sin limitación y, por tanto, la serie [16] «diverge hacia infinito». Para 
ver esto observamos que 


sa = 1 + t/s, . 
sa = Sa + (t/a + 1/4) > sa + (/a + 1/4) = 1 + ?/2, 
se = sa + (Us + 0: + 1/8) > sa + (a + +00 +18) = sa +a > 1 +92, 


y, en general, A 
som >14 z [18] 


Así, p. ej., la suma parcial sam es mayor que 100 en cuanto m > 200. 
Aunque la serie armónica no converge, la serie 


1 1 
+3 tE 


1 + 33 


1 
e asrki 19] 
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se demuestra que es convergente para todo valor de s mayor que 1, 
y define, para todo s > 1, la llamada función zeta: 


1 1 1 1 
(0 tim (14 tarot) cuando n>o0, [20] 
como función de la variable s. Existe una importante relación entre 
esta función y los números primos, la cual puede establecerse utili- 
zando nuestros conocimientos acerca de la serie geométrica. Sea 


p=2, 3, 5, 7, ..., un número primo cualquiera; para s > 1 se tiene: 
1 
0< ps <1, 
de forma que 
1 1 


Multipliquemos todas estas expresiones, correspondientes a los suce- 
sivos números primos p = 2, 3, 5, 7, ..., sin preocuparnos de la validez 
de tal operación. En el primer miembro obtenemos el «producto» 


infinito 
1 1 A dora 
11705) li=17) (6315) 
1 1 
= límite para n +00 de 11" ... 1% > 


mientras que en el segundo aparece la serie 
1 1 
1 + ta +: = os), 


debido al hecho de que todo número entero mayor que 1 puede ser 
expresado de manera única como producto de potencias de números 
primos diferentes. Tenemos así representada la función zeta mediante 


el producto 
3 1 1 1 
“9 ==) 333) Mi 1750) [21] 


Si sólo existiera un número finito de primos distintos, pı, Pz, P3, ---» Pr» 
el producto que figura en el segundo miembro de [21] sería un pro- 
ducto finito ordinario y tendría, por tanto, un valor finito incluso 
para s = 1. Pero, según hemos visto, la serie zeta para s = 1, 


UD = 1 +44 Ys + cc, 
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es divergente. Este razonamiento, que puede transformarse sin difi- 
cultad en una demostración rigurosa, prueba la existencia de infinitos 
números primos. Por supuesto que esta demostración es más sofística 
e indirecta que la dada por Euclides (véase pág. 29). Ofrece la fasci- 
nación de un difícil ascenso a un pico montañoso al que puede lle- 
garse desde el otro lado siguiendo una cómoda carretera. 

Los productos infinitos tales como [21] son a veces tan útiles 
como las series para la representación de las funciones. Otro producto 
infinito, cuyo descubrimiento es una más de las aportaciones de Euler 
a la matemática, se refiere a la función trigonométrica sen x. Para com- 
prender el desarrollo que sigue, comenzaremos con una observación re- 
lativa a las funciones enteras. Si f(x) = do + QT +... + ang” es un 
polinomio de grado n con n ceros distintos, 21, ..., Tn, se sabe por álge- 
bra que f(x) admite la siguiente descomposición en factores lineales: 


f(x) = an(x — 21) `++ (£ — £n) 


(véase pág. 110). Sacando factor común el producto xi £2... Ln, po- 
demos escribir: 


Tt T xr 
A A 


siendo C una constante cuyo valor, C = ap, se obtiene sin más que 
hacer x = 0. Si en lugar de polinomios consideramos funciones f(x) 
más complicadas, surge la cuestión de si es posible todavía una des- 
composición en producto de f(x) mediante sus ceros. (Que esto en 
general no es posible se ve considerando el ejemplo de la función 
exponencial, la cual carece de ceros, pues ex Æ 0 para todo x). Euler 
descubrió que para la función seno tal descomposición es posible. Con 
el fin de establecer la fórmula del modo más sencillo, consideremos 
sen rx en lugar de sen x. Esta función tiene los ceros x = 0, +1, +2, 
+3, ... ya que sen zn = 0 para todo valor entero n, y sólo para ellos, 
La fórmula de Euler dice que 


qt a? a? al 
saze me (1 = (- (0-5 jo [22] 


Este producto infinito converge para todo x y es una de las fórmulas 
más bellas de la matemática. Para x =1f2 se obtiene: 


T i 1 1 1 
sen y 21 52.12 1 92. 92 1 22.32 1 9.42) 








A 








w 
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Si escribimos 
1 (Qn — 1) 2n +1) 


22. n? 2n + 2n 
obtenemos el producto de Wallis 
mT 2 2 4 4 6 6 8 8 
2 1 3 3 5 5 7 7 
mencionado en la página 311. 
Las demostraciones de todos estos resultados pueden consultarse 
en los textos de cálculo (véanse también págs. 519-520). 


das 








r 





**JV. EL TEOREMA DE LOS NÚMEROS PRIMOS DEDUCIDO 
POR MÉTODOS ESTADÍSTICOS 


Al aplicar los métodos matemáticos al estudio de los fenómenos 
naturales, nos quedamos satisfechos de ordinario con argumentacio- 
nes en cuyo desarrollo se interrumpe la concatenación del razona- 
miento lógico estricto mediante hipótesis más o menos plausibles. 
Incluso en la matemática pura se encuentran razonamientos que, si 
bien no procuran una demostración rigurosa, sugieren, no obstante, 
la solución correcta y señalan la dirección en que debe buscarse una 
demostración precisa. La solución de Bernoulli del problema de la 
braquistocrona (véase pág. 393) tiene este carácter, como así ocurre 
con la mayor parte de los primeros trabajos en el desarrollo del aná- 
lisis matemático. 

Por medio de un procedimiento típico de la matemática aplicada, 
y, en particular, de la mecánica estadística, vamos a presentar una 
argumentación que por lo menos hace plausible la verdad de la famosa 
ley de Gauss sobre la distribución de los números primos (un proce- 
dimiento análogo le fué sugerido a uno de los autores por el físico 
experimental Gustav Hertz). Este teorema, discutido empíricamente 
en el suplemento al capítulo I, dice que el número A(n) de números 
primos no superiores a n es asintóticamente equivalente a n/log n: 


A ~ En 


Esto significa que el cociente de A(n) por n/log n tiende al límite 
1 cuando n tiende a infinito. 

Comencemos haciendo la hipótesis de la existencia de una ley ma- 
temática que describa la distribución de los números primos en el 
sentido siguiente: para valores grandes de n, la función A(n) es apro- 


ximadamente igual a la integral f W(x) dx, siendo W(x) una función 
2 
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que mide la «densidad» de los números primos. (Elegimos 2 como 
límite inferior de la integral, por la razón de que para x < 2 eviden- 
temente A(x) = 0.) Para precisar más, sean x y Arx dos números 
grandes, pero tales que el orden de magnitud de x sea superior al 
de Ax (p. ej., podemos convenir en que Ar = yx). Hecho esto, 
es posible decir que la distribución supuesta de los números primos es 
tal que el número de primos contenidos en el intervalo [x, x + Ax] es 
aproximadamente igual a W(x): Ar y, además, que W(x) es una 


n 
función de x cuya variación es tan lenta que la integral Í W(x) dx 
2 


puede sustituirse por una. aproximación rectangular sin que varíe su 
valor asintótico. Después de estas observaciones preliminares, esta- 
mos en condiciones de comenzar el razonamiento. 

Hemos demostrado ya (pág. 481) que para valores grandes, log n! 
es asintóticamente igual a n log n: 


log n! ~ n - logn. 


Vamos ahora a dar una segunda fórmula para log n! relacionada con 
los números primos y a comparar las dos expresiones. Veamos el nú- 
mero de veces que un número arbitrario p menor que n se halla con- 
tenido como factor en el entero n! = 1-2-3 +++ n. Representaremos 
por [a], el máximo entero k tal que pk divide a a. Por ser única la 
descomposición en factores primos de cualquier entero, resulta que 
[ab] p =[a]p + [6] p para dos enteros cualesquiera a y b; por consiguiente, 


[nl]p = [ip + lp + [3)p +05 + [n] 


Los términos de la sucesión 1, 2, 3, ..., n, que son divisibles por p¥ 
son pk, 2p¥, 3p¥, ...; su número Ny para valores grandes de n es apro- 
ximadamente n/p¥. El número My de estos términos que son divisi- 
bles por pk y no lo son por potencias mayores de p es igual a Nk — Nx+1; 
por tanto, 


[n]p = Mi + 2M2 + 3M3 + +- 
= (Ni — Na) + XN — Ns) + 3(N3 — Na) + :>* 
= Ni + Nat Nat 
n n n n 


=— +z tzt 
p P P p=1 





(Estas igualdades son, naturalmente, sólo aproximadas.) 
Resulta que para valores grandes de n el valor de n! viene dado, 
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n 
aproximadamente, por el producto de todas las expresiones p»=1 
para todos los primos p < n. Tenemos así la fórmula 


mu Y 
ogn ~ PE 


p<n 





log p. 


Al comparar esta con la relación asintótica anterior de log n!, obte- 
nemos, sustituyendo n por x, 


lo 
log r ~ > EE 11] 
p=1 


p<x 


El paso siguiente y decisivo consiste en obtener una expresión asin- 
tótica en función de W(x) para el segundo miembro de [1]. Como zx es 
muy grande, podemos subdividir el intervalo comprendido entre 2 y 
x=mn en un gran número r de subintervalos mediante la elección 
de los puntos 2 = či, Es, ..., Er, Er+1 = x, con los correspondientes 
incrementos Aé; = Ejy1 — čj. En cada subintervalo pueden existir 
números primos, y todos los existentes en el j-ésimo subintervalo 
tendrán aproximadamente el valor £;. Dada nuestra hipótesis acerca 
de W(x), existen aproximadamente W(E¡) + AÉ¡ números primos en el 
subintervalo j-ésimo, y, en consecuencia, la suma del segundo miem- 
bro de [1] es aproximadamente igual a 


r+1 


1 
> WE) E 


j=1 





Reemplazando esta suma finita por la integral que la aproxima, ob- 
tenemos como consecuencia plausible de [1] la relación 


PEE a 





log e ~ f. WO z [2] 
A partir de esta última vamos a determinar la función desconocida 
W(x). Si sustituímos el signo ~ por el ordinario de igualdad y deri- 
vamos ambos miembros respecto a x, por el teorema fundamental del 
cálculo se obtiene: 


1 l log x 
ás W(x) == ti 
[3] 





wW z 
(z) = xlogz 
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Hemos supuesto al comienzo de nuestra discusión que A(x) es apro- 


ximadamente igual a f W(x) dx; por tanto, A(x) viene dado aproxi- 
2 


"aain d 
¿Tlog x de 14] 


Para calcular esta integral observemos que la derivada de la función 
f(x) = x/log x es 


madamente por la integral 





1 
logx (log z)? 





Mx) = 


Para valores grandes de x, las dos expresiones 


1 1 1 1 
logx (log a)" logx  xlogx 





son aproximadamente iguales, pues para tales valores de x el sus- 
traendo en ambas diferencias es mucho menor que el minuendo. En 
consecuencia, la integral [4] será asintóticamente igual a la integral 











za x£ 2 
fro dz = f(x) — {(2) ar ` log?’ 
ya que los integrandos son casi iguales a lo largo de la mayor parte 
del intervalo de integración. El término 2/log 2 puede despreciarse 
para valores grandes de x por tener valor constante, con lo que obte- 
nemos finalmente el resultado 


A(x) ~ 





t 
log x’ 
que es la expresión del teorema citado sobre números primos. 

No es posible pretender que la argumentación precedente sea más 
que una mera sugerencia, aunque un análisis más detallado pone de 
manifiesto el siguiente hecho: no es difícil dar una justificación com- 
pleta de todos los pasos que con tanto atrevimiento hemos dado; en 
particular, para la ecuación [1], para la igualdad asintótica entre esta 
suma y la integral [2], y para el paso que conduce de [2] a [3]. Bas- 
tante más difícil es probar la existencia de la función de densidad W(x) 
que hemos supuesto al principio; pero una vez hecha esta hipótesis, 
el cálculo de la función es cuestión relativamente sencilla. Desde este 
punto de vista, la demostración de la existencia de tal función repre- 
senta la dificultad fundamental del problema de los números primos. 


APÉNDICE 


OBSERVACIONES SUPLEMENTARIAS 
PROBLEMAS Y EJERCICIOS 


Muchos de los problemas que siguen a continuación están pensa- 
dos para el lector con cierta formación matemática, y su intención 
no es tanto la de desarrollar una técnica rutinaria como la de estimu- 
lar la habilidad inventiva. 


Aritmética y Álgebra. 


1. ¿Cómo veríamos que 3 no divide a ninguna potencia de 10, 
según se afirma en la página 70? (véase pág. 54). 

2. Demuéstrese que el principio del mínimo entero es una conse- 
cuencia del teorema de inducción matemática (véase pág. 26). 

3. Haciendo uso del teorema del binomio, aplicado al desarrollo 
de (1 + 1)2, demuéstrese que C2 + C3 + C8 +... + CE = 2, 

*4. Considérese un entero, z = abc ..., y fórmese la suma de sus 
cifras a + b + c + ... Réstese ésta de z, táchese una de las cifras del 
resultado y sea w la suma de las restantes cifras. Conociendo sola- 
mente w, ¿puéde darse una regla para determinar la cifra tachada? 
(Existe un caso ambiguo cuando w = 0.) Al igual que de otras mu- 
chas propiedades sencillas de las congruencias, puede hacerse uso de 
ésta como pasatiempo curioso. 

5. Una progresión aritmética de primer orden es una sucesión de 
números, a, a + d, a + 2d, a + 3d, ..., tales que la diferencia entre 
dos términos consecutivos es constante. Una progresión aritmética de 
segundo orden es una sucesión de números ay, 42, 43, ..., con la propie- 
dad de que las diferencias a;,1 —aj forman una progresión aritmética de 
primer orden. Análogamente, una progresión aritmética de orden k es 
una sucesión tal que dichas diferencias forman una progresión arit- 
mética de orden k — 1. Demuéstrese que los cuadrados de los números 
enteros constituyen una progresión aritmética de segundo orden, y esta- 
blézcase por inducción que las potencias de exponente k de dichos nú- 
meros forman una progresión aritmética de orden k. Demuéstrese que 
cualquier sucesión cuyo n-ésimo término, an, viene dado por la expre- 
sión Co + cin + can? +... + cinKE, en la cual las & son constantes, es 
una progresión aritmética de orden k. Pruébese el teorema recíproco de 
este último para k=2, k=3, y, en general, para cualquier valor de k. 
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6. Demuéstrese que la suma de los n primeros términos de una 
progresión aritmética de orden k es a su vez una progresión aritmética 
de orden k + 1. 

7. ¿Cuántos divisores tiene el número 102967? (véase pág. 32). 

8. Utilizando la identidad algebraica (a24-b2) (c24-d2) =(ac—bd)3?+ 
+(ad+bcy, demuéstrese por inducción que cualquier número entero 
r = (142 ... An, donde todas las a; son sumas de dos cuadrados, es 
asimismo una suma de dos cuadrados. Compruébese esto con 2= 
= 12 + 12, 5 = 12 + 2% 8 = 22 + 22, etc., para r = 160, r = 1600, 
r = 1300 y r = 625. Obténganse, si es posible, diferentes representa- 
ciones de estos números como sumas de dos cuadrados. 

9. Aplíquese el resultado del ejercicio anterior para construir nue- 
vas ternas de números pitagóricos partiendo de una terna dada. 

10. Establézcanse reglas de divisibilidad, análogas a las dadas en 
la página 42, para los sistemas de numeración de bases 7, 11 y 12. 

11. Pruébese que para dos números racionales positivos, r = afb 
y s = cjd, la desigualdad r > s equivale a la ac — bd > 0. 

12. Demuéstrese que para r y s positivos y r< s, se verifica 
siempre que 





TaS A EA 
"2 SS Y A F ae 


13. Siendo z un número complejo, pruébese por inducción que 
za + 1/27 puede expresarse como polinomio de grado n en la variable 
w = z + 1/z (véase pág. 109). 

*14, Utilizando la notación abreviada cos ọ -+ i sen y = E(ọ), se 
tiene [E(ọ)]™ = E(mọ). Utilícense esta fórmula y las dadas en la pá- 
gina 20 en relación con las progresiones geométricas (todas ellas con- 
servan su validez para números complejos), para demostrar que 


< 2rs < (r + s}. 


cos- — cos (n + 1/2)p 
sen q + sen 2ọ + sen 3p + -** + sen nọ = > A 


2 — 
sen 2 


sen (n + /a)p 
2 sen 1/2p 








1/2 + cos p + cos 2p + cos 3p + + + cos nọ = 


15. Determínese la fórmula resultante de sustituir q por E(p) en 
la fórmula del ejercicio 3 de la página 25. 


Geometría analítica. 


Un estudio cuidadoso de los ejercicios que siguen, suplementado 
con dibujos y ejemplos numéricos, ayudará mucho a dominar los ele- 
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mentos de la geometría analítica. Se suponen conocidos las definicio- 
nes y los resultados más sencillos de la trigonometría. 

Es con frecuencia útil imaginar una recta o un segmento como 
orientados de uno de sus puntos a otro. Por recta orientada PQ (o 
segmento orientado PQ) entendemos la recta (o segmento) que tiene 
el sentido de P a Q. En ausencia de una especificación explícita, una 
recta orientada l se supondrá con un sentido fijo arbitrario, salvo para 
el eje x, que se considerará siempre orientado de O a un punto de 
abscisa positiva, y análogamente para el eje orientado y. Las rectas 
orientadas (o los segmentos) se dirán paralelas únicamente cuando 
tienen el mismo sentido. El sentido de un segmento de una recta 
orientada se indicará atribuyendo signo más o menos a la distancia 
entre los extremos del segmento, según que éste tenga el mismo sen- 
tido que la recta o. el opuesto. Es conveniente extender la termino- 
logía de «segmento PQ» al caso en que P y Q coinciden; a tal «segmento» 
se le asigna evidentemente longitud cero, pero carece de dirección. 

16. Demuéstrese que si Pı (x,, Y1) y Pa (£2, ya) son dos puntos 
cualesquiera, las coordenadas del punto medio, Po(£o, Yo), del segmen- 
to P,P2 son: Zo = (xı + 12)/2, Yo = (Yı + y2)/2. En general, demués- 
trese que si Pı y P2 son distintos, las coordenadas del punto Py de 
la recta orientada P,P2 para el cual el cociente P¡Po : P¡P2 de los 
segmentos orientados tiene el valor k, son: 


Lo = (1 — k)z1 + kx, yo = (1 — kyi + kyz. 


(Varias rectas paralelas determinan segmentos proporcionales sobre 
dos transversales.) 

Así, los puntos de la recta P,Pz tienen coordenadas de la forma 
To = At -+ koxe, Y = MY1 + Aya, con A + àz = 1. Los valores A1=1 
y A = 0 caracterizan los puntos P, y P2, respectivamente. Los valo- 
res negativos de àz corresponden a los puntos anteriores a P}. 

17. Caracterícese la posición de los puntos de una recta en forma 
análoga a la anterior, mediante los valores de k. 

Es igualmente importante utilizar números positivos y negativos 
para indicar los sentidos de los giros en idéntica forma a como hemos 
hecho para las distancias. Por definición, el sentido de una rotación 
que lleve el eje orientado x a coincidir con el eje orientado y después 
de un giro de 900 se considera positivo. En el sistema usual de coor- 
denadas, con el eje positivo x orientado hacia la derecha y el eje 
positivo y, hacia arriba, el sentido positivo corresponde al sentido 
de rotación contrario al de las agujas del reloj. Definimos el ángulo 
de dos rectas orientadas lı y l2 como igual al ángulo que debe girar l 
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para quedar paralela a l2. Naturalmente, este ángulo está determi- 
nado salvo un múltiplo entero de 360% (un giro completo). Así, el 
ángulo del eje orientado x con el eje orientado y es 90° o —2700, etc. 
18. Si es a el ángulo que forma el eje orientado x con la recta 
orientada l; Pı y Pz dos puntos cualesquiera de l, y d la distancia orien- 
tada de Pı a P2, demuéstrese que 
La — xı Ya — yı 


cosa = =——; sen a = 
do? d 





, (£2 — 11) sen a = (Ya — Y1) Cos x. 


Si la recta Į no es perpendicular al eje x, la pendiente de lse define como 


El valor de m no depende de la elección de sentido sobre la recta, ya 
que tg x = tg (a + 1809), o lo que es equivalente: (y1 — y2)/(11—t2)= 
=(Ya — Y1)/(£2 — 21). 

19. Demuéstrese que la pendiente de una recta es nula, positiva 
o negativa según que una paralela a ella por el origen coincida con el 
eje x, esté en el primero y tercer cuadrantes, o en el segundo y cuarto, 
respectivamente. 

En una recta orientada l distinguiremos el lado positivo del nega- 
tivo de la forma siguiente: sea P un punto cualquiera exterior a l y Q 
el pie de la perpendicular a 1 por P. Diremos que P se encuentra en 
el lado positivo o negativo de l, según que el ángulo de [ con la recta 
orientada QP sea 90° o —900, 

Vamos ahora a determinar la ecuación de una recta orientada l. 
Tracemos por el origen O una recta m perpendicular a l, y orientada 
de forma que el ángulo que forme con l sea de +90°. Al ángulo que 
forma el eje orientado x con m le llamaremos B; por tanto, «=90%4-B, 
sen «= cos B, cos «= — sen B. Sea R, de coordenadas z; e yı, el punto 
de intersección de m y l; representaremos por d la distancia orientada 
OR a la recta orientada m. 

20. Demuéstrese que d es positivo si y sólo si O es un punto del 
lado negativo de l. 

Tenemos: xı = d cos B, yı = d sen B (compárese con ejercicio 18). 
Por tanto, (x — x) sen « = (y — yı) cos a; o bien, (x — d cos fB) cos f 
= —(y — d sen ß) sen f, lo que da la ecuación 


xcosB + ysenf — d =0, 


Esta es la forma normal de la ecuación de la recta l. Obsérvese que esta 
ecuación no depende del sentido positivo asignado a l, pues un cam- 
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bio de éste haría cambiar el signo de todos los términos del primer 
miembro, y, en consecuencia, la ecuación quedaría invariable. 

Si se multiplica la ecuación normal por un factor arbitrario, re- 
sulta la forma general de la ecuación de la recta 


ar+by+<c=0. 


Para obtener de. nuevo, a partir de esta forma general, la forma 
normal —tan llena de significado geométrico— debemos multiplicar 
por un factor que reduzca los dos primeros coeficientes a cos f y sen $, 
la suma de cuyos cuadrados ha de ser 1. Esto se consigue multipli- 
cando por el factor 1/4/a2 + b?, que nos da la forma normal 





a b c 
== Y + 45 M; 
Vaj Va +0 Va? + 0? 
de modo que tenemos: 
a B b 8 c E 
— === = Cos [, "n = senp, -e 
Væ + Va + 02 Va + b? 


21, Demuéstrese: a) que los únicos factores que reducen la forma 
general a la normal son 1/4/a? + b2? y —1/ya + b?; b) que la elec- 
ción de uno u otro de estos factores determina el sentido positivo 
asignado a la recta, y c) que cuando se utiliza uno de estos factores, 
el origen se halla en el lado positivo o negativo de la recta orientada 
resultante, o bien sobre la propia recta, según que d sea negativo, 
positivo o nulo, l 

22. Demuéstrese directamente que la recta de pendiente m que 
pasa por un punto dado Po(xo, Yo) está representada por la ecuación 


Y — yo = m(x — Lo), 0 y = MI + Yo — MX. 


Demuéstrese que la recta determinada por los dos puntos Py(x1, yı), 
Pa(xe, ya) tiene la ecuación 


(Ya — y1) (£ — 21) = (x2 — 11) (y — Yu). 


La abscisa x del punto donde una recta o curva corta al eje de las x 
se llama abscisa en el origen de la línea; análogamente para la orde- 
nada en el origen. 

23. Si se divide la ecuación general del ejercicio 20 por una cons- 
tante apropiada, se ve que la ecuación de una recta puede escribirse 
en la forma 


x y 
a 
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al 


donde a y b son la abscisa y la ordenada en el origen. ¿Qué excepcio- 
nes se presentan? 

24. Por un procedimiento análogo, pruébese que la ecuación de 
una recta no paralela al eje y puede escribirse en la forma 


y = mx + 


(Si la recta es paralela al eje y, la ecuación correspondiente es r=a.) 

25. Sean ar + by 4c=0y dx + by +<=0 las ecuaciones de 
dos rectas l y l’, de pendientes m y m', respectivamente. Demuéstrese 
que | y l son paralelas o perpendiculares según que: a) m = m' o 
mm! = —1;b)ab' — a'b = 0 o aa' + bb’ = O [obsérvese que b) subsiste 
aun cuando la recta no tenga pendiente, esto es, sea paralela al eje y}. 

26. Demuéstrese que la ecuación de una recta que pasa' por un 
punto dado Po(xo, Yo) y es paralela a una recta dada l, ar+by+c=0, 
tiene la ecuación ax + by = axo + byo. Pruébese que subsiste una 
fórmula análoga, bx — ay = bxy — Ayo, para la ecuación de la recta 
que pasa por Py y es perpendicular a !. (Obsérvese que si la ecuación 
de l se da en la forma normal, así resulta también la nueva ecuación 
en cada uno de los casos.) 

27. Sean x cos 8 + y sen B —d=0 y ar + by + c = Q las for- 
mas normal y general de la ecuación de una recta l. Demuéstrese que la 
distancia orientada h de l a un punto cualquiera Q(u, v) viene dada por 





h = u cos fl + v sen fB — d, 
o por 
au + bv +c . 
CV 
y que h es positivo o negativo según que Q esté del lado positivo o 
negativo de la recta orientada Z (el sentido ha sido determinado por 
B, o por la elección del signo antepuesto a y/a2 + b2). (Escríbase la 
forma normal de la ecuación de la recta m que pasa por Q y es pa- 
ralela a 1 y hállese la distancia de l a m.) 
28. Representemos por l(x, y) =0 la ecuación de la recta ar+ 
+ by +c=0; análogamente, l'(x, y) =0. Sean Ay M constantes 
tales que A + M = 1. Demuéstrese que si Z y l’ se cortan en Po(xo, yo), 
la ecuación de cualquier recta que pase por Pp es de la forma 


Mz, y) + NU(z, y) = 0, 
y recíprocamente; y que cada una de tales rectas queda univocamente 
determinada por la elección de un par de valores para A y WM (Po está 
sobre l si y sólo si (£o, yo) = azo + byo + c = 0.) ¿Qué rectas quedan 
representadas cuando l y l son paralelas? Obsérvese que la condi- 
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ción A + à = l es innecesaria, pero sirve para determinar una sola 
ecuación para cada recta que pasa por Po. 

29. Utilicese el resultado del ejercicio anterior para hallar la 
ecuación de una recta que pase por la intersección Po de l y l y por 
otro punto, Pi(x,, yı), sin determinar las coordenadas de Pp. (Deter- 
mínense A y X por las condiciones A(z, Y) + XU (z1 y1) = 0,1 + M=1.) 
Compruébese el resultado determinando las coordenadas de Po (véase 
pág. 85) y demuéstrese que Po pertenece a la recta cuya ecuación 
acaba de escribirse. 

30. Demuéstrese que las ecuaciones de las bisectrices de los án- 
gulos formados por las rectas no paralelas 1 y l’ son: 


Va? db? lx, y) = 94 VW 02 + d2 1(x, y) 


(véase ejercicio 27). ¿Qué representan estas ecuaciones si l y l son 
paralelas? 

31. Hállese la ecuación de la mediatriz del segmento P,Po, utili- 
zando cada uno de los siguientes métodos: a) determiínese primero la 
ecuación de la recta P¡P2, después las coordenadas del punto medio 
Po del segmento PP», y, finalmente, la ecuación de la recta que pasa 
por Po y es perpendicular a P,P»; b) escríbase la ecuación que expresa 
que la distancia de P, a un punto cualquiera de la mediatriz P(x, y) es 
igual a la distancia de Pz a P. Basta elevar después ambos miembros 
al cuadrado y simplificar. 

32. Hállese la ecuación de la circunferencia determinada por tres 
puntos no colineales Pı, Pz, P3, aplicando cada uno de los siguientes 
métodos: a) escríbanse primero las ecuaciones de las mediatrices de 
los segmentos P,P2 y P2Pg; a continuación determínense las coordena- 
das del centro, hallando la intersección de estas dos rectas, y, final- 
mente, hállese el radio como distancia entre el centro y Pi; b) la 
ecuación debe ser de la forma qz? + y2 — 2ax — 2by = k (véase pági- 
na 83). Como cada uno de los puntos dados pertenece a la circunfe- 
rencia, debe tenerse: 

xi + y] — 2ax, — 2by1 = k; 
xå + y3 — 2ax2 — 2bya = k; 
13 + y3 — 2ax3 — 2bys = k, 


ya que un punto pertenece a la curva si y sólo si sus coordenadas 
satisfacen a la ecuación de la misma. Basta ahora resolver este siste- 
ma de ecuaciones respecto a a, b y k. 

33. Para hallar la ecuación de la elipse de eje mayor 2p, eje 
menor 2q y focos F(e, 0) y F(—e, 0), siendo e? = p? — q?, hágase uso 
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de las distancias r y r’ de los focos F y F’ a un punto cualquiera de 
la curva. Por definición de elipse, r + r’ = 2p, y por medio de la 
fórmula para la distancia, dada en la página 82, véase que 


12 — r? = (æ + e} — (x — e = der. 








Como 
12 — r? = (r + r) (r — r) = 2p(1" — r), 


se tiene que 7’ — r = 2ex/p. Resuélvase el sistema formado por esta 
ecuación y la r' + r= 2p y determínense las importantes fórmulas 


e e 
a —-= y => ; 
IFP ERP 
Como (por la fórmula de la distancia) r2 = (x — e)? + y?, igualando esta 


e 2 
expresión de r? a la que se acaba de obtener, (- Pa + p) , resulta: 


2 
e 


Basta ahora desarrollar, agrupar términos semejantes, sustituir 
p? — q? por e y simplificar. Compruébese que el resultado puede 
expresarse en la forma 

a. p 


prat 

Hágase lo mismo para la hipérbola, definida como el lugar de los 
puntos P para los cuales el valor absoluto de la diferencia r — r’ es 
igual a una cantidad dada 2p. En este caso, el = p? + q? 

34. Se define la parábola como el lugar de los puntos cuya dis- 
tancia a una recta fija (directriz) es igual a su distancia a un punto 
dado (foco). Si elegimos la recta x = —a como directriz y el punto 
F(a, 0) como foco, compruébese que la ecuación de la parábola puede 
escribirse en la forma y? = 4ax. 


Construcciones geométricas. 


35. Demuéstrese la imposibilidad de construir con la regla y el 
compás los números %3, Y 4, Y5. Pruébese que la construcción de 
Y a sólo es posible si a es el cubo de un número racional (véanse pági- 
nas 146 y siguientes). 

36. Hállense los lados de los polígonos regulares de 3. 2a y 
5 - 2n lados y caracterícense las correspondientes sucesiones de exten- 
siones del campo. 

37. Demuéstrese la imposibilidad de trisecar con regla y compás 
los ángulos de 1200 y 300, (En el caso de 30°, la ecuación de que de- 
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pende la demostración es 473 — 3z = cos 300 = 1/2 y/3. Introdúzcase 
como nueva incógnita u = z 4/3 y obténgase una ecuación en z a 
partir de la cual se deduce la imposibilidad de la construcción de z, 
en igual forma que en el texto, pág. 151.) 

38. Demuéstrese que el eneágono regular no es construíble. 

39. Demuéstrese que la inversión de un punto P(x, y) en el pun- 
to P'(x', y”), respecto al círculo de radio r y centro en el origen, está 
definida por las ecuaciones 

xr > yr 
Saye Va 


Hállense algebraicamente las ecuaciones que definen x e y en función 
de x’ e y. 

*40. Demuéstrese analiticamente, utilizando el resultado ante- 
rior, que el conjunto de todas las circunferencias y rectas del plano 
se transforma en sí mismo por inversión. Compruébense las propieda- 
des a) hasta d) de la página 155 por separado, y en forma análoga las 
transformaciones correspondientes a la figura 61. 

41. ¿En qué se transforman las dos familias de rectas x=cons- 
tante e y = constante mediante una inversión respecto a una circun- 
ferencia de centro en el origen y radio 1? Hállese la respuesta sin 
geometría analítica y también haciendo uso de ésta (véase pág. 172). 

42. Efectúense las construcciones de Apolonio para los casos más 
sencillos que elegirá el lector. Inténtese la solución analítica siguiendo 
el método de la página 136. 


Geometría proyectiva y geometría no euclídea. 


43. Determínense todos los valores de la razón doble A de cuatro 
puntos armónicos al efectuar todas las permutaciones de éstos. (Res- 
puesta: A = —1, 2, 1/2.) 

44. ¿Para qué configuraciones de cuatro puntos coinciden algunos 
de los seis valores de la razón doble dados en la página 188? (Respuesta: 
sólo para A = —1 y A = 1; existe también un valor imaginario de A 
para el cual à = 1/(1 — A), razón doble «equianarmónica».) 

45. Demuéstrese que si la razón doble (ABCD) vale 1, coinciden 
los puntos C y D. 

46. Demuéstrense las proposiciones dadas en la página 188 res- 
pecto a la razón doble de cuatro planos. 

47. Demuéstrese que si P y P’ son inversos respecto a una cir- 
cunferencia y si el diámetro AB es colineal con P y P’, los puntos 
A, B, P, P’, forman una cuaterna armónica. (Utilicese la expresión [2] 
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de la pág. 189, tomando como circunferencia el círculo unidad y 
AB como eje.) 

48. Hállense las coordenadas del cuarto punto armónico de tres 
puntos Py, P2, P3. ¿Qué ocurre si P3 pasa a ser el punto medio de 
P,P2a (véase pág. 190). 

*49, Hágase uso de las esferas de Dandelin para desarrollar la 
teoría de las cónicas. Demuéstrese en particular que todas son (salvo 
la circunferencia) lugares geométricos de puntos cuyas distancias a 
un punto fijo F y a una recta dada l están en una razón constante k. 
Para k> 1 se tiene la hipérbola; para k = 1, la parábola, y para 
k < 1, la elipse. La recta l se obtiene como intersección del plano de 
la cónica con el plano de la circunferencia de contacto de la esfera 
de Dandelin y el cono. (Ya que la circunferencia no queda incluída 
en esta caracterización si no es como caso límite, no resulta completa- 
mente adecuado elegir esta propiedad para definir las cónicas, si bien 
se hace así algunas veces.) 

50. Estúdiese la proposición siguiente: «una cónica considerada a 
la vez como conjunto de puntos y como conjunto de rectas es una 
figura dual de sí misma» (véase pág. 221). 

*51. Inténtese demostrar el teorema de Desargues en el plano 
por medio de un paso al límite efectuado en la configuración tridi- 
mensional de la figura 73 (véase pág. 184). 

*52, ¿Cuántas rectas pueden trazarse que se apoyen en cuatro 
rectas dadas del espacio? ¿Cómo pueden ser caracterizadas? (Trácese 
una hiperbolvide por tres de las rectas dadas; véase pág. 224.) 

*53. Si el círculo de Poincaré es el círculo unidad del plano com- 
plejo, dos puntos zı y zə y los valores wı y wa de los dos puntos de 
intersección de la «recta» que pasa por estos dos puntos con la circun- 

; A : A 21 — Wı 29 — W, 
ferencia unidad, definen una razón doble ————=: =— 
21, — W, Z — W: 
acuerdo con lo dicho en el ejercicio 8 de la página 107, es real. Por 
definición, su logaritmo es la distancia hiperbólica entre zı y 22. 

*54. Transfórmese mediante una inversión el círculo de Poincaré 
en el semiplano superior. Desarróllese el modelo de Poincaré y sus. 
propiedades para este semiplano, directamente y mediante esta inver- 
sión (véase pág. 236). 


que, de 


Topología. 

55. Verifíquese la fórmula de Euler para los cinco poliedros regu- 
lares, así como para otros poliedros, llevando a cabo las correspon- 
dientes reducciones de la red de polígonos. 
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56. En la demostración de la fórmula de Euler (pág. 251) se tra- 
taba de reducir una red plana de triángulos, por sucesiva aplicación 
de dos operaciones fundamentales, en otra red formada por un solo 
triángulo, para la cual V — A + C =3 — 3 + 1 = 1. ¿Cómo podre- 
mos asegurarnos de que el resultado final no será una pareja de triángu- 
los sin ningún vértice común, de forma que V—-A+C=6-—6+4-2=2? 
(Se supone que la red primitiva es conexa; esto es, que se puede pasar de 
un vértice a otro a lo largo de los lados de la red. Demuéstrese que 
esta propiedad se conserva en las dos operaciones fundamentales.) 

57. Hemos admitido sólo dos operaciones fundamentales para la 
reducción de la red antedicha; ¿no puede suceder que en algún paso 
un triángulo tenga sólo un vértice común con otros triángulos de la 
red? (Constrúyase un ejemplo.) Esto requeriría una tercera opera- 
ción: supresión de dos vértices, tres aristas y una cara; ¿afectaría 
esto a la demostración? 

58. ¿Se puede arrollar una tira ancha de caucho tres veces alre- 
dedor de un palo de escoba de forma que quede plana (esto es, no 
retorcida) sobre el palo? (Naturalmente, la tira de caucho debe cru- 
zarse consigo misma en algún punto.) 

59. Demuéstrese que un disco circular del cual se ha separado 
un punto en el centro, admite una transformación continua sin punto 
fijo, en sí mismo. UN 

*60. La transformación que traslada cada punto de un disco una 
unidad en una dirección determinada, carece evidentemente de pun- 
tos fijos. Por supuesto, no es ésta una transformación del disco en sí 
mismo, ya que algunos puntos quedan exteriores al disco. ¿Por qué 
no es válido el razonamiento de la página 267 basado en la transfor- 
mación P > P*? 

61. Supóngase un neumático de caucho cuyo interior está pin- 
tado de blanco y su exterior de negro. ¿Es posible, si se efectúa un 
pequeño orificio, se deforma el neumático y a continuación se cierra 
el agujero, que la parte interior quede fuera, de modo que el inte- 
rior sea negro y el exterior blanco? 

*62, Demuéstrese que no existe «problema de los cuatro colores» 
en tres dimensiones, probando que para cualquier número dado n se 
pueden colocar n cuerpos en el espacio de manera que cada uno toque 
a los restantes. 

*63. Haciendo uso de una superficie tórica (interior de un neumá- 
tico, arganeo) o de una región plana con identificación de contorno (fi- 
gura 143), constrúyase un mapa formado por siete regiones, de manera 
que cada una tenga frontera común con las restantes (véase pág. 260). 
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64. El tetraedro tetradimensional de la figura 118 consta de cinco 
puntos a, b, c, d y e, cada uno de los cuales está unido a los otros 
cuatro. Incluso si los segmentos que los unen pueden curvarse, no es 
posible dibujar la figura en el plano de forma que no se crucen dos 
cualesquiera de las conexiones. Otra configuración con diez conexio- 
nes que tampoco puede ser trazada en el plano sin cruces es la for- 
mada por seis puntos, a, b, c, a”, b’, c”, tales que cada uno de los pun- 
tos a, b, e, esté unido a cada uno de los a”, b”, c’. Verifíquense experi- 
mentalmente estos hechos e inténtese una demostración basada en el 
teorema de la curva de Jordan. (Ha sido demostrado que cualquier con- 
figuración de puntos y rectas que no pueda representarse en el plano 
sin cruces debe contener como parte una de estas dos configuraciones.) 

65. Una configuración está formada por las seis aristas de un te- 
traedro tridimensional a las que se ha añadido el segmento que une 
los puntos medios de dos aristas opuestas. (Dos aristas de un tetraedro 
son opuestas si carecen de vértice común.) Pruébese que esta configura- 
ción es equivalente a una de las descritas en el ejercicio precedente. 

*66. Sean p, q, r, las tres puntas del símbolo E. El símbolo se 
desplaza una cierta distancia, lo que da lugar a otra E de puntas 
p', q, r'. ¿Puede unirse p con p’, q con q' y r con r’ por tres curvas 
que no se crucen entre sí ni tampoco a los dos símbolos? 

Si recorremos el contorno de un cuadrado cambiamos nuestra di- 
rección cuatro veces, cada una 90°, lo que hace un total de A = 3600, 
Si recorremos el contorno de un triángulo, es sabido por geometría 
elemental que A = 3600, 

67. Deznuéstrese que si C es un polígono simple cerrado, A=3600, 
(Descompóngase el interior de C en triángulos y sepárense segmentos 
del contorno como en la pág. 251. Sean los sucesivos contornos 
Bı, B2, B3, ... Bn. Entonces, Bı = C y Bn es un triángulo. Pruébese 
que si A; corresponde a Bi, se verifica que A; = Ajy.1.) 

*68. Sea C una curva simple cerrada con vector tangente que 
gira con continuidad. Si A representa la variación total del ángulo de 
la tangente al recorrer una vez la curva, pruébese que A = 3600, 
(Sean po, pi, p2, - Pn» Po, puntos que descomponen C er' pequeños 
arcos aproximadamente rectilíneos. Sea C; la curva que corresponde a 
los segmentos PoP1, P1P2, ..., Pi-1Pi y los arcos originales pipiyi, ..., PnPo- 
Entonces, Co = C y Cy se compone de segmentos rectilíneos. Demués- 
trese que A; = Anı, y utilicese el resultado del ejercicio precedente.) 
¿Es aplicable esto a la hipocicloide de la figura 55? 

69. Demuéstrese que si en el diagrama de la botella de Klein de 
la página 275 las cuatro flechas se trazan en el sentido de las agujas 
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del reloj, la superficie así formada es equivalente a una esfera con 
un disco reemplazado por una cofia cruzada. (Esta superficie es topo- 
lógicamente equivalente al plano de la geometría proyectiva.) 

70. La botella de Klein de la figura 142 puede cortarse en: dos 
mitades simétricas por medio de un plano. Demuéstrese que el resul- 
tado son dos cintas de Moebius. 

*71. En la cinta de Moebius de la figura 139 se identifican los 
dos extremos de cada segmento transversal; demuéstrese que el resul- 
tado equivale topológicamente a una botella de Klein. 

Todas las posibles parejas de puntos de un segmento rectilíneo 
(cuyos extremos coinciden o no) forman un cuadrado en el sentido 
siguiente: Si se designan los puntos del segmento por sus distancias 
x, y a un extremo A, las parejas ordenadas de números (x, y) pueden 
considerarse como las coordenadas cartesianas de un punto del cuadrado. 

Todas las posibles parejas de puntos sin tener en cuenta el orden 
[es decir, (x, y) = (y, x)] forman una superficie S que equivale topoló- 
gicamente a un cuadrado. Para verlo, elíjase aquella representación 
que tiene el primer punto más próximo al extremo A del segmento 
si x Æ y. Por tanto, S es el conjunto de todos los pares (x, y) en los 
cuales o x es menor que y o x = y. Utilizando coordenadas cartesianas, 
esto da el triángulo plano de vértices (0,0), (0,1), (1,1). 

+72. ¿Qué superficie se forma considerando el conjunto de todos 
los pares ordenados de puntos de los cuales el primero pertenece a una 
recta y el segundo a una circunferencia? (Respuesta: un cilindro.) 

73. ¿Qué superficie se forma al considerar el conjunto de todos 
los pares ordenados de puntos de un círculo? (Respuesta: un toro.) 

*74. ¿Qué superficie resulta al considerar el conjunto de todos 
los pares no ordenados de puntos de un círculo? (Respuesta: una cinta 
de Moebius.) 

75. He aquí las reglas de un juego para realizarlo con monedas en 
una gran mesa circular: A y B, por turno, colocan monedas sobre la 
mesa, las cuales no es necesario que se toquen y pueden colocarse en 
cualquier punto de la mesa en tanto que no sobresalgan del borde 
o cubran parte de una moneda ya colocada. Una vez colocada una 
moneda, no puede moverse. Con el tiempo, la mesa quedará cubierta 
de monedas de forma que no habrá lugar para otra, ganando aquel 
jugador que acierte a colocar la última moneda. Si comienza A, de- 
muéstrese que cualquiera que sea la forma de jugar B, A puede estar 
seguro de ganar con tal que juegue correctamente. 

76. Si en el juego del ejercicio anterior la mesa tiene la forma 
indicada en la figura 125 b, demuéstrese que B puede ganar siempre. 


COURANT. — 18 
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Funciones, límites y continuidad. 


77. Hállese el desarrollo en fracción continua del cociente OB: AB 
de la página 134. 
nótona creciente y acotada por B = 2; en consecuencia, tiene límite. 
Pruébese que este límite es el número 2 (véanse págs. 135 y 337). 

*79. Inténtese demostrar por métodos análogos a los utilizados 
en las páginas 329 y siguientes que, dada una curva cerrada sin pun- 
tos singulares (óvalo), se puede siempre trazar un cuadrado cuyos 
lados sean tangentes a la misma. 

La función u = f(x) se llama convexa si el punto medio del seg- 
mento que une dos puntos cualesquiera de la gráfica de la función 
queda por debajo de la curva; p. ej., u = ex (Fig. 278) es convexa, 
pero no lo es u = log x (Fig. 277). 

80. Demuéstrese que la función u == f(x) es convexa si y sólo si 





Kæ) + f(x2) X1 + T2 ) 
5 >f 3 j 
El signo de igualdad únicamente se verifica para xı = T2. 

*81. Demuéstrese que para las funciones convexas se verifica la 
desigualdad más general 


M/(x1) + dfles) > {Axı + A2ta), 


en la cual M, As, son dos constantes tales que M + àz = 1 y M >O, 
2 > 0. Esto equivale a decir que ningún punto del segmento que 
une dos puntos de la gráfica queda por debajo de la curva. 

82. Haciendo uso de la condición del ejercicio anterior, demués- 
trese que las funciones u = y/ 1 +x? y u =1/x (para x > 0) son 
convexas; esto es, que 











2 


Vit + Vitz y pp) 
do a a E , 





1 1 1 2 
A E ir ara x xz positivos. 
Aiti) se? 1y Tp 

83. Hágase lo mismo con u = 12, u = x” para 7 > 0, u = sen x 
para n <x < 2x, u = tg x para 0 <x < 7/2, u = —a/ 1 — z? para 
|z| <1. 


MÁXIMOS Y MÍNIMOS 511 


Máximos y mínimos. 


84. Hállese el camino más corto entre P y Q como en la figu- 
ra 178, en el supuesto de que la trayectoria encuentre a las dos rectas 
dadas n veces alternativamente (véase pág. 344). 

85. Hállese el camino más corto entre dos puntos P y Q interio- 
res a un triángulo acutángulo si la trayectoria debe encontrar a los 
lados del triángulo en un orden dado (véase pág. 345). 

86. Trácense las curvas de nivel y compruébese la existencia de 
dos puntos de ensilladura, por lo menos, en una superficie sobre un 
dominio. triplemente conexo cuya frontera se halla al mismo nivel 
(véase pág. 355). Se excluye el caso en que el plano tangente a la su- 
perficie es horizontal a lo largo de una curva cerrada. 

87. Partiendo de dos números racionales positivos arbitrarios a, b, 
fórmense paso a paso los pares de números An+1= V Anbn, Dn+1 = 
== 1/2 (An + bn). Demuéstrese que definen un encaje de intervalos. (El 
punto límite cuando n > œ, que recibe el nombre de media arit- 
mético-geométrica de ao y bo, desempeñó un papel importante en las 
primeras investigaciones de Gauss.) 

88. Hállese la longitud de toda la curva de la figura 219, y com- 
párese con la longitud total de las dos diagonales. 

*89. Hállense las condiciones que determinan si cuatro pun- 
tos Ar, Az, Ag, Aa, se encuentran en el caso de la figura 216 o de 
la 218. 

*90. Determinense sistemas de cinco puntos para los cuales exis- 
tan diferentes redes de caminos que satisfagan las condiciones angu- 
lares. Sólo algunas de ellas serán mínimos relativos (véase pág. 370). 

91. Establézcase la desigualdad de Schwarz 


(arbi + > + anban)? < (a) +e + a) (b3 + > + ba), 


válida para cualquier conjunto de pares de números ai, bj; demués- 
trese que el signo de igualdad solamente se verifica si los a, son pro- 
porcionales a los b;. (Generalícese la fórmula algebraica del ejercicio 
8 anterior.) 

*92. Con n números positivos £i, ..., £n, formamos las expresio- 
nes sx definidas por 


Sy = (2122 + Tx + “o )Cys 


donde el símbolo «+ ...» significa que deben sumarse todos los pro- 
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ductos de k de estos factores, elegidos de todas las maneras posibles, 
cuyo número es C%. Demuéstrese que 


k+ 
V Sk+1 < < Vi , 


donde el signo de igualdad solamente se verifica si todas las x; son 
iguales. 

93. Para n = 3 estas desigualdades expresan que para tres nú- 
meros positivos a, b, c, 


EuS ab + ac + be a b c 
Ya < | 3 < Tot 





¿Qué propiedades extremales del cubo están implícitas en estas des- 
igualdades? 

*94. Determínese un arco de curva de longitud mínima que una 
dos-puntos A, B, e incluya, con el segmento AB, un área dada. (Res- 
puesta: el arco es circular.) 

95. Dados dos segmentos AB y A'B', hállese un arco que una A 
con B, y otro que una A” con B’, tales que ambos arcos incluyan, 
con los dos segmentos, un área dada, y al mismo tiempo tengan lon- 
gitud total mínima. (Respuesta: los dos arcos son circulares y del 
mismo radio.) 

*96. La misma o as el número de segmentos dados 
es cualquiera, AB, A'B’, 

*97. Sobre dos rectas se se cortan en O, determínense dos pun- 
tos A y B, respectivamente, y únanse mediante un arco de longitud 
mínima y tal que el área comprendida por éste y las rectas sea dada. 
(Respuesta: el arco es circular y perpendicular a ambas rectas.) 

*98. El mismo problema, pero incluyendo ahora el perímetro total 
del dominio; es decir, el arco, más OA, más OB, ha de ser mínimo. 
(Respuesta: la solución es un arco de circunferencia con la concavidad 
hacia afuera y tangente a ambas rectas.) 

*99. La misma cuestión para varios sectores angulares. 

*100. Demuéstrese que las superficies casi planas de la figura 240 
no son planas salvo para la superficie estabilizadora del centro. Ob- 
servación: hallar o caracterizar analíticamente estas superficies es un 
problema sin resolver. Lo mismo puede decirse respecto a las superficies 
de la figura 251. En la figura 258 se tienen en realidad doce planos 
de simetría que se cortan bajo ángulos de 1200 en las diagonales, 

Háganse algunos experimentos adicionales con películas jabonosas. 
Efectúense los experimentos indicados en las figuras 256 y 257, con 
más de tres barras. Estúdiense los casos límites al tender a cero el 
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volumen de aire incluído. Háganse experimentos con planos no para- 
lelos u otras superficies distintas. Hágase que la burbuja cúbica de 
la figura 258 llene todo el cubo y resalte sobre las aristas, sacando 
de nuevo el aire e invirtiendo el proceso. 

*101. Determínense dos triángulos equiláteros de perímetro total 
dado y área mínima. (Los triángulos deben ser congruentes, Hágase 
uso del cálculo.) 

*102. Hállense dos triángulos de perímetro total dado y área 
máxima. (Respuesta: un triángulo degenera en un punto; el otro es 
equilátero.) 

*103. Hállense dos triángulos de área total dada y perímetro 
mínimo. 

*104, Hállense dos triángulos equiláteros de área total dada y 
perímetro máximo. 


Cálculo. 
105. Derívense las funciones y/1 +x, y 1 +z, y + : por 


aplicación directa de la definición de derivada, formando y operan- 
do con el cociente de diferencias hasta obtener el límite por sustitu- 
ción de xı = x (véase pág. 431). 

106. Demuéstrese que la función y =e-1/x, con y=0 para 
æ = 0, tiene nulas todas sus derivadas en x = 0. 

107. Demuéstrese que la función del ejercicio anterior no puede 
desarrollarse en serie de Taylor (véase pág. 487). 

108. Determínense los puntos de inflexión [f'(x) = 0] de las cur- 
vas y = e6-*' e y = x e". 

109. Demuéstrese que si f(x) es un polinomio cuyos n ceros 
Zis ..., Zn, son distintos, se tiene: 


n 
ræ 1 
(5) 7 2, -x 


*110. Utilizando la definición de integral como límite de una 
suma, demuéstrese que para n —> oo se tiene: 








1 1 1 T 
H mEn t apna + ET > 


*111. Demuéstrese en forma análoga que 


b b 2b nb ad 
1 sen] + sen — + + sen- > cos b — 1. 


514 OBSERVACIONES, PROBLEMAS Y EJERCICIOS. —APEÉND. 


112. Dibujando la figura 276 a gran escala sobre papel milime- 
trado y contando los cuadraditos del área rayada, determínese un 
valor aproximado de v. 

113. Hágase uso de la fórmula [7], página 451, para el cálculo 
numérico de m con error menor que 1/100. 

114. Demuéstrese que eri = —1 (véase pág. 488). 

115. Una curva de forma dada se dilata en la relación 1: zx. 
L(x) y A(x) representan la longitud y el área de la curva dilatada. 
Demuéstrese que L(x)/A(x) >0 cuando xt —> œ, y, en general, 
L(x)/A(x)* > 0 para x tendiendo a infinito, si k > 1/2. Compruébese 
para el circulo, el cuadrado y la *elipse. (El área tiene orden superior 
de magnitud que la circunferencia. Véase pág. 482.) 

116. Con frecuencia la función exponencial aparece en combina- 
ciones para las que se emplea la notación siguiente: 


u = sh z = 1/g(ex — e-x), v = ch x =1/oex + e-x) 
ex — grx 
w = th t == ——, 
ex + e 


y que se llaman seno hiperbólico, coseno hiperbólico y tangente hiperbó- 
lica, respectivamente. Estas funciones gozan de muchas propiedades 
análogas a las de las funciones trigonométricas y se hallan relaciona- 
das con la hipérbola u? — v? = 1 en forma análoga a como las fun- 
ciones u = cos x y v = sen zx están relacionadas con la circunferencia 
ul + v? = 1, El lector establecerá las siguientes propiedades, compa- 
rándolas con las correspondientes de las funciones trigonométricas: 


Dchx = shz, Dshx=chx, D th x = 1/ch?z, 
sh (1+x%)=shzx-: cha" + chxshx, 
ch (x + x) = chx: chr’ + shr- shr. 


Las funciones inversas son: x = arg sh u = log (u + 4/u + 1); 
x = arg ch v = log (v + yv? — 1) (v > 1). 
Sus derivadas son: 


1 d 
D arg sh u = — ===; D arg ch v = — 
VI + Vo —1 








D arg th w = 5 (|w| >1) 


1 — w? 


117. Hágase uso de la fórmula de Euler para comprobar la ana- 
logía de las funciones hiperbólicas y trigonométricas. 
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*118. Hállense fórmulas sencillas de sumación para 


sh x + sh 2x + ++: + shnz 
l/a + chx + ch 2r + +- +chnz 


análogas a las dadas en el ejercicio 14 para las funciones trigono- 
métricas. 


Técnica de la integración. 


El teorema de la página 449 reduce el problema de integrar una 
función f(x), entre los límites a y b, al de hallar una función primitiva 
G(x) de f(x); es decir, tal que G'(x) = f(x). La integral es entonces la 
diferencia G(b) — G(a). Es habitual utilizar para estas funciones pri- 
mitivas, determinadas por f(x) (salvo una constante aditiva arbitra- 
ria), el nombre de «integral indefinida» y la sugerente notación 


G(x) = fro dz, 


(Esta notación puede resultar confusa para el principiante; véase la 
observación de la pág. 448.) 

Toda fórmula de derivación contiene la solución de uu problema 
de integración indefinida sin más que interpretarla al revés como fór- 
mula de integración. Podemos extender este procedimiento un tanto 
empírico mediante dos importantes reglas que no son sino las equi- 
valentes a las reglas de, derivación de una función compuesta y de 
un producto de funciones. En su forma integral, dichas reglas se lla- 
man de integración por sustitución y de integración por partes. 

A) La primera regla resulta de la fórmula de derivación de una 
función compuesta 

H(u) = G(x), 
en la que 

=Yy4u y  u=e() 
se suponen funciones inversas, unívocamente determinadas en el in- 
tervalo que se considera. Se tiene entonces 
H(u) = G(DY(w. 

Si 

G'(1) = [(z), 
podemos escribir 


G(x) -Í 10) de 


516 OBSERVACIONES, PROBLEMAS Y EJERCICIOS. —APÉND. 


y también 
C(Dy a) = [(2Y (0), 


lo cual, como consecuencia de la fórmula anterior para A'(u), equivale a 
H(u) = fw yu) du, 
Por tanto, ya que H(u) = Ga), 


fiw dx - fw Jy(u) du. tm 


Escrita con la notación de Leibniz (véase pág. 443), esta regla 
adquiere esta otra forma: 


dx 
J la) az = f 1e) i du 


dx 
que significa que el símbolo dx debe sustituirse por el símbolo —— 


dx du 
exactamente como si dx y du fueran números y T una fracción. 
u 


du, 


La utilidad de la fórmula [I] queda aclarada con unos cuantos 
ejemplos: 


1 
a) J= [AA Comenzamos aquí con el segundo miembro 
u log u 


de [1], sustituyendo x = log u = d(u). Tenemos así Y'(u) = l/u, 
jæ) = 1/x; por tanto, 
dx 
J= Pa log x, 


du TR 
ulogu og log u. 


Podemos comprobar este resultado derivando ambos miembros, lo que 


d 
nos da Tu (log log u), que, como fácilmente se comprue- 


ulogu — 
ba, es cierto. 


cos u 
b J= f cot u du = f du. Haciendo x=sen u=y(u) obte- 





sen u 
nemos: 
yu) = cosu, f(x) = z; 
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ze 1 
= z =1logz 


f eot u du = 10sen u. 


por tanto, 


Este resultado puede también comprobarse por derivación. 
c) En general, si tenemos una integral de la forma 


y(u) 
pu) 


hacemos x = (u), f(x) = x, y se obtiene: 


J = 





dx 
J= fE 082 = 10840. 


d 
d) J = | sen z cos z dz. Hacemos sen x = u, cos => y 


se tiene: 


du u3 
J = ug ET u du = 7 = '/s sen? z. 





J [a H EET T AEE ERN 
e) J= y Ju. Hacemos log u = z,- = y y obtenemos: 


J a dr z 1 
-|z 7 |1857" /a (log u}. 


En los ejemplos que siguen se utiliza [I] comenzando con el primer 
miembro. 
dx 
f) J = |—>. Sise hace yz = u, se tiene: x = u? y — da 2u; 
por tanto, 


1 S 
DPEN 


g) Mediante la sustitución z = au, siendo a constante, obtenemos: 


1 1 d 1 du 1 i z 
A _- ana u= or a a 
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—— dx 
h) J= fva — x? dr. Hagamos x = cos u, du = —5en u, con 


lo que 


1 — cos 2u u sen 2u 
J = — | sen? u du du = — + 








2 2 4 


Si utilizamos la fórmula sen 2u=2 sen u cos u=2 cos u V 1—costu, 
obtenemos: 
J = —1!/g arc cos x + Y V 1 — 2x2, 


Determínense las integrales indefinidas siguientes, comprobando 
los resultados por derivación: 











119 za 124 2 
) no Fra 
120) Í uev? du. 125) |E VIF B dt. 
121 E 126) |< as 
) u(log u)? ) Via ` 
122 wi 127 A 
) 374 ) ror% 
123 se 128 nt- sent- dt 
) ol ) | cos sen à 
. 129) Demuéstrese que 
dx 1 cd x£ dx i x 
AAA a arg a? a a es F 


[Compárese con los ejemplos g) y h)]. 
B) La regla (pág. 437) para derivar un producto, 


[p(x) > aœ) = plz) - q (2) + p2) : (2), 


puede escribirse como fórmula integral 


p(x) + q(x) - [co -< g'(x) de + fro - q(2) dx 


fo + g'(x) de = p(aja(a) — fro ` q(x) dz. (1 


Escrita en esta forma recibe el nombre de regla de integración por 
partes. Esta fórmula es muy útil cuando la función que ha de inte- 


TÉCNICA DE LA INTEGRACIÓN 519 


grarse puede escribirse en la forma p(x) g'(x), donde se conoce la 

función primitiva g(x) de q'(x). En tal caso, la fórmula [II] reduce 

el problema de hallar la integral indefinida de p(x) g'(x) al de la inte- 

gración de la función p'(x) q(x), que es con frecuencia más fácil. 
Ejemplos: 


a) J= f log x dr. Hagamos p(x) = log x, q'(x) = 1; de forma 
que q(x) = x. Aplicando [II] se obtiene: 


x 
fiosz az = zioaz — [az = 21082 — 2, 


b) J =f log x dx. Hagamos p(x) = log x, q'(x) = x, con lo 
que resulta: 
z3 
J= Zog- fiui y 182 
c) J -f x sen x dz. En este caso hacemos p(x) = x, q(1)= —cos x, 
y obtenemos: 
fosenzas = — 1C08 X + sen zT. 


Obténgase las siguientes integrales haciendo uso de la fórmula de 
integración por partes: 


130) | zer dx. 132) xilogrdx (a — 1). 


139 f x? cos z dz. saf qx? ex dz. 


(Aplíquese dos veces [11]) (Utilicese el ejercicio 130) 


La integración por partes de la integral f senm z dx conduce a 


una expresión notable para x como producto infinito. Para deducirla, 
escribamos la función sen™ x en la forma senm-1 y sen x e integremos 
por partes entre los Kmités 0 y 7/2, con lo cual obtenemos la fórmula 


7/2 7/2 
f senm zdr = (m — of sen™-2 q cosê x dr = 
0 o 
ni 
= — (m — 1) senm zde + (m — 1 È senm-8 r dx, 
o 0 
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1/2 m — 1 (72 
senK g dr = 5 senm-2 g dx, 


0. 0 


ya que el primer término del segundo miembro de [II], pq, es igual 

a 0 para los valores 0 y 1/2. Por aplicación reiterada de la última 
m/2 

fórmula, obtenemos el siguiente valor de Im Si senm x dx (las fór- 
0 

mulas difieren según que m sea par o impar): 


2n—1 2n-3 1 7 





Im = aa 2 2 a 
1 2n 2n — 2 2 
1041 224 1 mi 3 


Puesto que 0 < sen z < 1 para 0 < x < x/2, se obtiene sentn-1x > 
> sen?n y > sen?n+ y, de forma que 





T2n-1 > Lan > 12m+1 (véase pág. 424) 
o 

12n-1 Ian 

Izn41 12m+1 


Sustituyendo los valores calculados antes para f2n-:, etc., de las úl- 
timas desigualdades obtenemos: 

2n 4+1 1:3:3:5:5:7+-**(2n—-1)Qn—1)Qn+1) 7 

2n 7 2:2:4-4-6-6--- (2n)Qn) 2 





Si pasamos ahora al límite para n > œo, vemos que el término del 
centro tiende a 1, de donde obtenemos la representación de 1/2 me- 
diante el producto de Wallis: 








Tr 2:-2-4-4-6:-6:** 2n:2n-++ 
2 7 1:-3:3:5:5:7-**(2n — 1) (2n — 1)-(2n +1) 
24x(n1)1 
= lím para n > oo. 


[(2n)!]? (2n + 1) 


IX. AVANCES RECIENTES 


$1. UNA FÓRMULA PARA LOS PRIMOS 
[véase página 49] 


SE CONOCEN ahora muchos polinomios diferentes que producen números 
primos, aunque poco contribuyen a nuestro conocimiento sobre tales núme- 
ros; en lugar de ello, se demuestra que los polinomios pueden tener propie- 
dades muy extrañas. 

En su celebrada ponencia en el Congreso Internacional de Matemáticos, de 
1900, David Hilbert planteó 23 problemas cuya solución sentía que sería de la 
mayor importancia para el avance de las matemáticas. El décimo problema de 
Hilbert se plantea investigar si existe un método general (lo que ahora llama- 
ríamos algoritmo) para examinar si una ecuación diofantina tiene solución. 
En 1970, siguiendo el trabajo anterior de Martin Davis, Hilary Putnam y Julia 
Robinson, el matemático ruso Yuri Matyasevich demostró que no existe tal 
“algoritmo de decisión”. Como su método utiliza precisamente polinomios 
como un “lenguaje de programación” un tanto aparatoso con el cual se simu- 
lan algoritmos para computadora, los polinomios producidos son realmente 
enormes. James Jones descubrió un sistema explícito de ecuaciones polino- 
miales para el que no existe ningún algoritmo de decisión: consta de 18 ecua- 
ciones en 33 variables con grado máximo 5%0, 

Un resultado secundario intrigante de la demostración de Matyasevich es 
que existe un polinomio p(x}, ..., X,,) igual de complicado, en 23 variables, 
cuyos valores positivos para valores enteros de las variables son precisamente 
los primos. En 1976, J. P. Jones, D. Sato, H. Wada y D. Wiens publicaron un 
polinomio relativamente simple en 26 variables con la misma propiedad. 
Denotemos a las variables con a, b, c, ..., x, y, z (es una coincidencia, pero muy 
útil tipográficamente, que el alfabeto en inglés tenga 26 letras). Dicho poli- 
nomio es: 


(k+2)(1 — [w2 + h+j-q)?— [(gk+ 28 + k+ 1)(1 + j) + h- z]? 
- [2n+p+g+2-el? — [16(k+ D)XAk+2)(n+ 1)2+1-f2]2 
— [eó(e + 2)(a + 1)2+ 1 — 02]2— [(a2— 1)y2+1- x?]? 
— [16r2y Ya? — 1) + 1 — 12]? —- 
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— [((a+ u?(u? — a))? — 1)(n + 4dy?) + 1 — (x +cu)2]? — [n+1+ v— y]? — 
- [(a?— 1)12+ 1 — m?]2 — [ai+ k+ 1 — l — i]? 
— [p+l(a—n-— 1) + b(2an + 2a — n? — 2n — 2) — m}? 
— [q + y(a—p-— 1) + s(2ap + 2a — p? — 2p — 2) — x]? 
— [z + pl(a — p) + t(2ap — p? — 1) — pm]?}. 


Los valores positivos de esta expresión para valores enteros de a, ..., z son pre- 
cisamente los primos. 

Aparentemente hay una paradoja: es claro que la expresión puede descom- 
ponerse en factores, de hecho es de la forma (k + 2){1 — M}. Sin embargo, M 
es una suma de cuadrados, de manera que la expresión es positiva si y sólo si 
M =0, y su valor es entonces k + 2. Así que el polinomio M tiene que cons- 
truirse de manera que 


Mk, otras variables) =0 siy sólo si k + 2 es primo, 


lo que puede lograrse usando los métodos de Matyasevich. 

Este resultado se vuelve ligeramente menos intrigante cuando se hace claro 
que en este contexto nada hay de especial acerca de los primos: pueden ser 
reemplazados por cualquier sucesión de números “recursivamente enume- 
rable” —lo que significa esencialmente una sucesión infinita determinada 
por un sistema finito de condiciones computables— construyendo un polino- 
mio apropiado. El avance del descubrimiento radica en que el concepto de 
“computabilidad” puede expresarse en el lenguaje de los polinomios, no en 
que la teoría de los primos pueda simplificarse introduciendo una fórmula 
algebraica. 


$92. LA CONJETURA DE GOLDBACH Y LOS PRIMOS GEMELOS 
[véase página 54] 


La conjetura de Goldbach de que todo número par mayor que 2 es una suma 
de dos primos, y la cercanamente relacionada “conjetura de los primos geme- 
los” de que existe una infinidad de primos p para los cuales p + 2 también es 
primo, permanecen abiertas. Sin embargo, ahora se sabe bastante más acerca 
de ambas cuestiones. 

Uno de los métodos más poderosos para abordar algunos problemas en la 
teoría de los números es el análisis complejo, idea que se remonta a Euler y que 
fue explotada en particular por Riemann en su estudio de la función zeta £(s) 
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(véase página 525). A partir de 1920, Godfrey H. Hardy y John E. Littlewood 
investigaron la aplicación de la teoría analítica de los números, como se le 
llegó a llamar, a cuestiones relacionadas con la representación de números 
como sumas de números de tipos especiales. En 1937, I. M. Vinográdov utilizó 
esos métodos para demostrar que todo número impar suficientemente grande 
es una suma de tres primos, lo cual mejoró su resultado de cuatro primos, 
citado por Courant y Robbins en la página 55, que había sido demostrado en 
1934. Según expresaron Courant y Robbins, este teorema sólo se aplica a nú- 
meros “suficientemente grandes” —números mayores que algún valor parti- 
cular 1n¿—, aunque la demostración de Vinográdov no especifica qué tan 
grande debe ser ng. En 1956, K. G. Borodzkin llenó este hueco mostrando que 
ny = exp[exp(16.038)] es suficiente, donde exp(x) = e*. Varios matemáticos 
usaron el método de Vinográdov para demostrar que “casi todos” los números 
pares son la suma de dos primos, es decir, que la proporción de tales núme- 
ros hasta algún límite n tiende a 100% conforme n tiende a infinito. 

En 1919, Viggo Brun introdujo un enfoque diferente, el “método de la cri- 
ba”, que generaliza la criba de Eratóstenes (véase página 49), el cual usó para 
demostrar que todo entero par suficientemente grande es una suma de dos 
números, siendo cada uno de ellos un producto de a lo más nueve primos, 
Siguieron una serie de mejoras a este teorema por parte de varias personas. 
Por ejemplo, en 1937, G. Ricci demostró que todo entero par suficientemente 
grande es una suma de dos números, siendo uno de ellos un producto de a lo 
más dos primos, y el otro un producto de a lo más 366 primos. P. Kuhn usó 
ideas sobre combinatoria de A. A. Buchstab para demostrar que todo entero 
par suficientemente grande es una suma de dos números, cada uno de los 
cuales es producto de a lo más cuatro primos. En 1957, Wang Yuan demostró 
que todo entero par suficientemente grande es una suma de un primo y un 
producto de a lo más tres primos, bajo la suposición de que se cumple la 
hipótesis generalizada de Riemann. 

La hipótesis clásica de Riemann, otro de los 23 problemas de Hilbert y 
todavía (discutiblemente) la mayor cuestión sin resolverse en todas las mate- 
máticas, tiene que ver con la función zeta de Riemann £(s) cuando la variable s 
es compleja. Específicamente, enuncia que si ¿(s) = 0 y s no es real entonces 
s= 3 + iy para algún real y. Las consecuencias de demostrar este enunciado 
serían espectaculares: revolucionarían la teoría de los números y la geometría 
algebraica. Más aún, cualquier método para resolver tal problema es casi se- 
guro que se extendería a otras variantes importantes tales como la hipótesis 
generalizada de Riemann, un enunciado considerablemente más fuerte del 
mismo tipo general. Debido a que la hipótesis de Riemann y sus generaliza- 
ciones constituyen un obstáculo tan significativo para el progreso, los espe- 
cialistas en teoría de números han desarrollado el hábito de arrojar anzuelos 
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exploratorios al territorio que queda más allá, basando parte de su trabajo en 
la suposición explícita de que la hipótesis de Riemann, o alguna de sus gene- 
ralizaciones, es verdadera. Una justificación de este proceder es la posibilidad 
de que pueda llevar a una contradicción, exponiendo entonces la hipótesis de 
Riemann como falsa; pero esto es mera especulación. Los especialistas en 
teoría de números son impacientes, no pueden esperar para ver qué hay más 
allá del Gran Obstáculo. 

En ocasiones, una vez que tal territorio ha sido explorado, aparecen nuevas 
posibilidades que permiten que se prescinda de la suposición. En 1948, sin su- 
poner la hipótesis generalizada de Riemann, Alfred Rényi demostró que todo 
entero par suficientemente grande es una suma de un primo y un producto de 
a lo más c primos para algún c fijo pero desconocido. En 1961, M. B. Barban 
mostró que c = 9 basta. En 1962, Pan Cheng Dong redujo esto a c = 5; poco 
después Barban y Pan lo redujeron, independientemente, a c = 4, y en 1965, 
Buchstab demostró el teorema para c = 3. Finalmente, en 1966, Chen Jing Run 
mejoró el método de la criba y demostró el teorema para c = 2. Es decir, todo 
entero par suficientemente grande es una suma de un primo y un producto de 
al menos dos primos: “primo más casi primo”. Éste es el resultado más cer- 
cano, que se conoce hasta la fecha, a la conjetura de Goldbach. 

Se ha abordado la conjetura de los primos gemelos con un espíritu similar. 
El artículo de Brun de 1919 demostró también que hay una infinidad de 
números p tales que p y p + 2 son ambos un producto de a lo más nueve pri- 
mos. En correspondencia a las mejoras al resultado de Brun sobre la conjetura 
de Goldbach, hubo mejoras similares a su trabajo sobre la conjetura de los 
primos gemelos. En 1924, Rademacher redujo el número nueve de Brun a 
siete. Buchstab lo redujo aún más, a seis en 1930 y a cinco en 1938. En un 
artículo de 1957, Wang indicó: “también se han obtenido resultados análogos 
en el problema de los primos gemelos”; dicha afirmación —puesta en el con- 
texto de la demostración, ese mismo año, de que todo entero par suficiente- 
mente grande es una suma de un primo y un producto de a lo más tres pri- 
mos— equivale a sostener que hay una infinidad de números p tales que tanto 
p como p + 2 son un producto de a lo más tres primos. Tomando como válida 
la hipótesis generalizada de Riemann, Wang mostró en 1962 que existe una 
infinidad de primos p tales que p + 2 es un producto de a lo más tres primos. 
En 1965, sin necesidad de usar la hipótesis de Riemann, Buchstab demostró 
que para algún c fijo existe una infinidad de primos p tales que p + 2 es un 
producto de a lo más c primos. En un artículo de 1973, Chen demostró que 
c = 2 basta y, otra vez, es éste el resultado más cercano que se conoce a la con- 
jetura de los primos gemelos. Parece improbable que los métodos actuales 
puedan lograr una mejor aproximación al resultado: se requiere de una idea 
genuinamente novedosa. 


526 AVANCES RECIENTES [1x] 


§3. EL ÚLTIMO TEOREMA DE FERMAT 
[véase página 66] 


Uno de los avances más dramáticos desde que Courant y Robbins escribieron 
¿Qué son las matemáticas? fue la demostración del último teorema de Fermat 
en 1994, dada por Andrew Wiles, de la Universidad de Princeton. Recordemos 
que Fermat conjeturó que la ecuación 


x” +y" =z” (1) 


no tiene soluciones enteras distintas de la solución cero cuando n = 3. La 
demostración de Wiles es muy técnica y sólo accesible a los expertos; sin 
embargo, el bosquejo general de la demostración sí es comprensible. El ataque 
es esencialmente indirecto y usa bastante la teoría de las “curvas elípticas”, las 
cuales están definidas por ecuaciones diofantinas de la forma 


y? =ax? + bx? +cx+d (2) 


para números racionales a, b, c y d. (El adjetivo “elípticas” se deriva de rela- 
ciones con las llamadas funciones elípticas, y no se refiere a la forma de la cur- 
va.) Se sabe mucho acerca de tales ecuaciones: constituyen una de las áreas 
mejor y más profundamente entendidas de la teoría de números. 

La ecuación de Fermat (1) puede reescribirse como (x/z)" + (y/z)" = 1, de 
manera que el punto (X, Y) = (x/z, y/z) está en la curva de Fermat con ecua- 
ción 

X"4Y"=1, (3) 


Se dice que (X, Y) es un punto racional si tanto X como Y son números racio- 
nales. Entonces el último teorema de Fermat es equivalente a la afirmación 
de que ningún punto racional puede estar en la curva de Fermat (3) cuando 
n > 3. Entre 1970 y 1975, Yves Hellegouarch investigó una relación curiosa 
entre las curvas de Fermat (3) y las curvas elípticas (2). Jean-Pierre Serre su- 
girió intentar lo inverso: explotar propiedades de las curvas elípticas para 
demostrar resultados relacionados con el último teorema de Fermat. En 1985, 
Gerhard Frey dio forma concreta a esta sugerencia introduciendo lo que ahora 
se llama la curva elíptica de Frey, asociada con una presumible solución de la 
ecuación de Fermat. Supóngase que hay una solución no trivial A” + B” = C” 
de la ecuación de Fermat, y fórmese la curva elíptica 


y? =x(x + A")(x— B”), (4) 
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que es precisamente la curva elíptica de Frey, la cual existe si y sólo si el último 
teorema de Fermat es falso. Así que para demostrar el último teorema de 
Fermat es suficiente demostrar que la curva de Frey (4) no puede existir; la 
manera de hacerlo es siguiendo el método “indirecto” de demostración (véase 
página 113): es decir, suponer que sí existe y deducir una contradicción, lo 
que implicaría que la curva de Frey no existe después de todo y que por 
lo tanto el último teorema de Fermat es verdadero. Frey encontró fuerte evi- 
dencia de que su curva “no debiera existir” demostrando que ésta tiene mu- 
chas propiedades notablemente extrañas cuya base es de improbable solidez. 
En 1986 Kenneth Ribet estableció claramente el problema demostrando que la 
curva de Frey no puede existir siempre y cuando la conjetura de Taniyama, un 
gran problema abierto en teoría de números, sea verdadera. De esta manera 
redujo un importante problema abierto, el último teorema de Fermat, a otro 
problema abierto importante. Este tipo de reducción con frecuencia resulta 
inútil: sólo reemplaza un problema difícil por otro más difícil; pero en este 
caso se dio en la veta, pues proporcionó un contexto para atacar el problema. 
La conjetura de Taniyama es muy técnica también, pero puede explicarse 
haciendo referencia a un caso especial. Hay una íntima relación entre la 
“ecuación pitagórica” a? + b? = e?, el círculo unitario y las funciones tri- 
gonométricas seno y coseno. Para encontrar esta relación, obsérvese que la 
ecuación pitagórica puede reescribirse en la forma (a/c)? + (b/c)? = 1, lo cual 
implica que el punto (x, y) = (a/c, b/c) está en el círculo unitario, cuya ecua- 
ción es x? + y? = 1. Es bien sabido que las funciones trigonométricas propor- 
cionan un modo sencillo de representar el círculo unitario. Específicamente, 
el teorema de Pitágoras y la definición geométrica de sen y cos implican que la 

ecuación 
cos28 + sen? 8 = 1 (5) 


se cumple para cualquier ángulo 0 (véase página 312). Si hacemos x = cos 8 y 
y = sen 8 entonces (5) establece que el punto (x, y) está en el círculo unitario. 
Resumiendo: resolver la ecuación pitagórica en enteros es equivalente a en- 
contrar un ángulo 0 tal que tanto cos 8 como sen 8 sean números racionales 
(iguales respectivamente a a/c y b/c). Como las funciones trigonométricas tie- 
nen todo tipo de propiedades agradables, esta idea es la base de una teoría 
realmente fructífera de la ecuación pitagórica. 

La conjetura de Taniyama dice (en un contexto más bien técnico) que una 
idea de tipo similar puede aplicarse a cualquier curva elíptica, pero reem- 
plazando al seno y al coseno por funciones “modulares” más sofisticadas. Así, 
problemas sobre curvas elípticas pueden reemplazarse por problemas sobre 
funciones modulares, igual que problemas sobre el círculo pueden reempla- 
zarse por problemas sobre funciones trigonométricas. 
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Wiles se dio cuenta de que el acercamiento de Frey puede llevarse hasta una 
conclusión satisfactoria sin usar toda la fuerza de la conjetura de Taniyama. 
En lugar de eso, basta un caso particular, uno que se aplica a una clase de curvas 
elípticas conocidas como “semiestables”, En un artículo de cien páginas hizo 
acopio de un poderoso arsenal para demostrar el caso semiestable de la conje- 
tura de Taniyama, que lleva al siguiente teorema. Supóngase que M y N son 
enteros diferentes, distintos de cero y primos relativos tales que MN(M—N) 
es divisible entre 16. Entonces la curva elíptica y? = x(x + M)Mx + N) puede 
parametrizarse mediante funciones modulares. De hecho, la condición de 
divisibilidad entre 16 implica que esta curva es semiestable, de manera que la 
conjetura semiestable de Taniyama establece la propiedad deseada. 

Ahora aplicamos el teorema de Wiles a la curva de Frey (4) haciendo M= A" 
y N = —B"”. Entonces M — N = A" + B” = C”, de manera que MN(M — N) = 
—A"” B” C”, lo cual debemos mostrar que es un múltiplo de 16. Ahora, al me- 
nos uno de los números A, B y C debe ser par —pues si A y B son ambos 
impares, C” es una suma de dos impares y por lo tanto par, lo cual implica 
que C es par—. Además podemos suponer que n = 5, pues hace mucho tiem- 
po Euler demostró el último teorema de Fermat para n = 3. Pero dado que la 
quinta potencia o una mayor de un número par es divisible entre 25 = 32, el 
número —A*B*"C* es un múltiplo de 32, así que claramente también un múl- 
tiplo de 16. Por lo tanto la curva de Frey satisface la hipótesis del teorema de 
Wiles, implicando que puede ser parametrizada con funciones modulares. Sin 
embargo, la demostración de Ribet de que la conjetura de Taniyama implica 
la no existencia de la curva de Frey funciona demostrando que la curva de 
Frey no puede ser parametrizada con funciones modulares, lo que constituye 
una contradicción, así que el último teorema de Fermat es verdadero. 

Esta demostración es muy indirecta y requiere ideas sofisticadas. Más aún, 
surgieron algunas dificultades referentes a la primera versión de la demos- 
tración de Wiles que aumentaron el dramatismo. Él hizo circular un mensaje 
por correo electrónico a la comunidad matemática reconociendo esas dificul- 
tades pero asegurando su confianza en que sus métodos las resolverían. Las 
reparaciones a la demostración tomaron más tiempo del que se esperaba, 
pero el 26 de octubre de 1994 Karl Rubin hizo circular otro mensaje: “Como 
la mayoría de ustedes sabe, el argumento descrito por Wiles ([...] resultó tener 
un hueco importante, a saber, la construcción de un sistema de Euler. Después 
de tratar sin éxito de reparar esa construcción, Wiles regresó a un camino dis- 
tinto, el cual ya había intentado antes pero que había abandonado en favor de 
la idea del sistema de Euler. Entonces pudo completar su demostración.” 
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$4. LA HIPÓTESIS DEL CONTINUO 
[véase página 115} 


La hipótesis del continuo establece que el cardinal del conjunto de todos los 
números reales es el cardinal infinito más pequeño que es mayor que el de 
los enteros. Ahora se sabe que la hipótesis del continuo no es ni verdadera ni 
falsa, sino indecidible. Para entender lo que esto significa, debemos recordar 
brevemente el método axiomático (página 249). Dicho método particulariza 
un objeto matemático estableciendo un sistema explícito de condiciones, 
axiomas, que se requiere que el objeto satisfaga. Esto enfoca la atención en las 
relaciones abstractas entre ese objeto y otros, más que en los materiales pri- 
marios con los que está “construido”. Las presentaciones sencillas de la teoría 
de conjuntos dan por hecho que nociones tales como “conjunto” están defi- 
nidas, y describen cómo manipularlas. Para establecer un marco riguroso en 
el que se discuta la hipótesis del continuo, es necesario especificar un sistema 
de axiomas para la teoría de conjuntos. 

En 1964, Paul Cohen demostró que la veracidad de la hipótesis del continuo 
depende de cuáles axiomas se escojan para la teoría de conjuntos. Esta situa- 
ción es similar a la de la veracidad o falsedad del axioma de las paralelas de 
Euclides, lo cual depende del tipo de geometría: hay una geometría “euclidia- 
na” para la cual es verdadero, pero también hay geometrías “no euclidianas” 
para las cuales es falso (véase página 252). De manera similar, hay teorías de 
conjuntos “cantorianas” en las que la hipótesis del continuo es verdadera, y 
teorías de conjuntos “no cantorianas” en las que es falsa. Kurt Gödel había 
demostrado que la hipótesis del continuo es verdadera en algunas axiomati- 
zaciones de la teoría de conjuntos, y Cohen, usando una nueva técnica llama- 
da forcing, demostró que en otras axiomatizaciones es falsa. En particular, no 
hay una elección de axiomas distinguida que conduzca a una única teoría de 
conjuntos “natural”. 


$5. NOTACIÓN DE TEORÍA DE CONJUNTOS 
[véase página 140] 


La notación matemática sigue modas, y a veces la moda puede cambiar. En 
consecuencia, la terminología de Courant y Robbins en ocasiones difiere en 
detalles menores de la acostumbrada actualmente, pero esto rara vez es sufi- 
cientemente importante como para mencionarlo. En este caso particular, sin 
embargo, la diferencia con el uso actual es demasiado significativa como para 
ignorarla. 

Los términos “suma lógica” y “producto lógico” prácticamente no se usan 
en nuestros días; en su lugar se emplean las alternativas “unión” e “intersec- 
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ción”. El conjunto vacío se denota como Ø y no como O, y ya no se utiliza un 
símbolo especial, I, para el universo de discurso. Las notaciones actuales para 
la unión e intersección de dos conjuntos A y B son las siguientes: 


Unión: A U B (en lugar de la notación de Courant y Robbins, A + B) 
Intersección: A N B (en lugar de la notación de Courant y Robbins, AB). 


El complemento A” suele escribirse A“, pero todavía es común usar A”. La nota- 
ción actual para subconjuntos es cualquiera de los dos símbolos: C o C. 
A diferencia de < y <, la expresión A C B no implica que A + B, ni hoy ni en 
los tiempos de Courant y Robbins. Para denotar desigualdad en una relación 
de subconjuntos, se utiliza la incómoda notación A Ç B. 

Las notaciones A + B, AB y A’ sobreviven aún en las ciencias de la compu- 
tación y en la ingeniería electrónica, en las que se utilizan para describir cir- 
cuitos formados a partir de entradas lógicas. 

Irónicamente, la notación moderna oscurece las analogías algebraicas de 
las propiedades 6 a 17 de la página 140. Sin embargo, en vista de las propie- 
dades 10, 11 y 13, puede que esto no sea del todo grave. 


$6. EL TEOREMA DE LOS CUATRO COLORES 
[véanse páginas 280 y 299] 


El teorema de los cuatro colores fue demostrado en junio de 1976 por Kenneth 
Appel y Wolfgang Haken. Su demostración depende de que se muestre que 
unos dos mil mapas específicos se comportan de un modo particular algo 
complicado. Examinar todos esos casos resulta enormemente tedioso, así que 
usaron una computadora, la cual requirió de varios miles de horas para com- 
pletar las verificaciones. Ahora la demostración puede verificarse en pocas 
horas, gracias a mejores métodos teóricos y a computadoras más rápidas, pero 
todavía no se ha encontrado alguna demostración hecha a “lápiz y papel”. 
¿Existe una demostración más sencilla? Nadie sabe, aunque se ha visto que 
ninguna demostración sustancialmente más sencilla puede darse siguiendo 
líneas similares. 

La demostración de Courant y Robbins del teorema de los cinco colores 
(página 299) es una adaptación del trabajo de Arthur Kempe, un abogado y 
matemático aficionado, quien en 1879 publicó una presunta demostración 
del teorema de los cuatro colores. Utiliza una variante del método de induc- 
ción matemática (páginas 32 a 43), tomando como idea básica que si el teore- 
ma de los cuatro colores es falso entonces debe haber mapas que requieren un 
quinto color. Si tales mapas “malos” existen, pueden incorporarse a mapas 
más grandes en todas las maneras posibles, y todos ellos requerirán también 
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un quinto color. Como no tiene caso alguno hacer más grandes los mapas 
malos, hay que ir en sentido opuesto y examinar los mapas malos más peque- 
ños. Coloquialmente a un mapa así se le denomina minimal criminal.? La exis- 
tencia de un minimal criminal se sigue del principio del menor entero (pági- 
na 42), que es equivalente al principio de inducción matemática. Un minimal 
criminal se distingue por las siguientes dos propiedades: necesita cinco colo- 
res, y cualquier mapa con un número menor de países necesita sólo cuatro. La 
demostración procede haciendo uso de estas propiedades para restringir la 
estructura de un minimal criminal, hasta que finalmente se muestra que no 
existe minimal criminal alguno. Por contradicción (demostración indirecta, 
véase la página 113), el teorema debe ser verdadero. 

La idea de Kempe era partir de un minimal criminal y producir un mapa 
relacionado más pequeño, el cual, por la segunda propiedad mencionada an- 
teriormente, puede iluminarse con cuatro colores; de ahí, Kempe trató de 
deducir que el mapa original también se puede iluminar con cuatro colores: 
la contradicción requerida. Específicamente, el procedimiento consistía en 
tomar un minimal criminal y contraer a un punto alguna región conveniente- 
mente seleccionada; el mapa resultante tiene menos regiones, de manera que 
puede iluminarse con cuatro colores. Podría darse el caso de que fuera impo- 
sible regenerar la región contraída y encontrar un color para ella sin cambiar 
los colores del resto del mapa, a causa de que dicha región podría lindar con 
otras que ya usan los cuatro colores. Sin embargo, si la región que se contrae 
es un triángulo (una región que linda sólo con otras tres), no hay problema. 
Si es un cuadrado entonces se emplea una técnica artificiosa de intercambio 
de colores, llamada ahora “cadena de Kempe”, para cambiar uno de los colores 
vecinos, lo cual permite que la estratagema funcione. Si es un pentágono, man- 
tuvo Kempe, funciona un argumento similar. Finalmente, pudo demostrar 
que todo mapa debe contener ya sea un triángulo, un cuadrado o un pentágo- 
no, así que siempre hay una región adecuada para ser contraída y regenerada. 

En 1890, Percy Heawood encontró un error en el tratamiento de Kempe de 
las regiones pentagonales. Heawood notó que el método de Kempe puede re- 
mendarse para dar una demostración de que cinco colores son siempre sufi- 
cientes: un color adicional hace más fácil regenerar el pentágono. Ésta es la 
demostración presentada en la página 299. Por otra parte, nadie podía encon- 
trar un mapa que realmente necesitara cinco colores. 

En 1922, Philip Franklin demostró que todo mapa con 26 o menos regio- 
nes se puede iluminar con cuatro colores. Su método sentó las bases para el 
exitoso asalto final, con la idea de una configuración reductible. Una configu- 


t Literalmente, “criminal mínimo” o “menor infractor”. En lo que sigue, se usará el término 
empleado en la versión original en inglés, minimal criminal, para denominar a tal mapa que, a fin 
de cuentas, no existe. [N. E.] 
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ración es sólo un conjunto de regiones conectadas del mapa junto con infor- 
mación de cuántas regiones son adyacentes a cada una alrededor del exterior. 
Para ver lo que significa reductibilidad, considérese el ejemplo de contraer y 
regenerar una región triangular. Contráigase el triángulo a un punto y supón- 
gase que el mapa resultante, que tiene una región menos, puede iluminarse 
con cuatro colores; lo mismo puede hacerse entonces con el mapa original, 
pues el triángulo linda sólo con tres regiones y eso deja un cuarto color libre 
cuando dicho triángulo es regenerado en el mapa. De manera más general, 
una configuración es reductible si puede demostrarse que la iluminación con 
cuatro colores de cualquier mapa que la contiene es posible siempre que un 
mapa más pequeño pueda iluminarse con cuatro colores. Con un argumento 
similar se demuestra que los cuadrados son reductibles. Kempe pensó que los 
pentágonos eran reductibles, pero estaba equivocado. 

Evidentemente un minimal criminal no puede tener una configuración re- 
ductible, así que si mostramos que todo minimal criminal debe contener una 
configuración reductible, tenemos la contradicción requerida. El modo más 
directo de hacerlo es encontrar un conjunto de configuraciones reductibles 
que sea inevitable, en el sentido de que cualquier mapa (no sólo un minimal 
criminal) debe contener una de tales configuraciones. Kempe había intentado 
hacer eso precisamente: demostró que el conjunto (triángulo, cuadrado, pen- 
tágono) es inevitable, lo cual es correcto, pero cometió un error en la demos- 
tración de la reductibilidad del pentágono. Con todo, la estrategia básica de su 
demostración —encontrar un conjunto inevitable de configuraciones reduc- 
tibles— fue una idea brillante. : 

En 1950, Heinrich Heesch se convirtió en el primer matemático en afirmar 
públicamente que creía que el teorema de los cuatro colores podría demos- 
trarse encontrando un conjunto inevitable de configuraciones reductibles. Se 
dio cuenta, sin embargo, de que el conjunto inevitable tendría que contener 
muchas más configuraciones que las tres del intento fallido de Kempe, pues el 
pentágono ha de ser reemplazado por una copiosa lista de alternativas. De 
hecho, Heesch estimó que se necesitarían alrededor de 10000 configuracio- 
nes, cada una de ellas de tamaño moderado. Además, inventó un método para 
demostrar la inevitabilidad, basado en una vaga analogía eléctrica. Suponga- 
mos que se aplica una cierta cantidad de carga eléctrica a cada región, y luego 
se le permite moverse a regiones vecinas siguiendo diversas reglas. Por ejem- 
plo, podemos determinar que la carga sobre cualquier pentágono se divida en 
partes iguales y se transfiera a cualquiera de sus vecinos, excepto triángulos, 
cuadrados y pentágonos. A partir del análisis de los rasgos generales de las 
distribuciones de carga, se puede mostrar que deben darse ciertas configura- 
ciones específicas, pues de otra forma la carga “se esfumaría”. Recetas más 
complicadas llevan a listas más complicadas de configuraciones inevitables. 
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En 1970 Wolfgang Haken hizo mejoras al método de cargas de Heesch y 
empezó a pensar seriamente en resolver el problema de los cuatro colores. La 
mayor dificultad era el tamaño probable de configuraciones en el conjunto 
inevitable. Si partimos de un estimado de 10000 regiones para ser exami.- 
nadas en cuanto a su reductibilidad, el cómputo total podría fácilmente tomar 
un siglo. Y si, a fin de cuentas, una sola configuración del conjunto inevitable 
resultara no ser reductible, todo el cómputo habría sido inútil. 

Entre 1972 y 1974, Haken y Kenneth Appel comenzaron juntos un diálogo 
interactivo con la computadora para tratar de mejorar las posibilidades de 
éxito. La primera versión de su programa de computadora proporcionó mu- 
cha información útil. Modificaron después el programa para superar una serie 
de defectos e intentaron nuevamente. Aparecieron problemas más sutiles y 
fueron debidamente corregidos. Después de unos seis meses de este diálogo, 
Appel y Haken se convencieron de que su método para demostrar la inevita- 
bilidad tenía buenas posibilidades de éxito. En 1975, su programa de investi- 
gación pasó de la fase de exploración al ataque final. En enero de 1976, em- 
pezaron la construcción de un conjunto inevitable con unas 2 000 regiones, y 
para junio de 1976 su trabajo estaba completo. Entonces comprobaron la re- 
ductibilidad de cada configuración de este conjunto. Aquí la computadora 
demostró ser indispensable, reportando puntualmente que cada una de las 
2000 configuraciones del conjunto inevitable de Appel y Haken es reductible. 
Esto contradice la supuesta existencia de un minimal criminal, de manera que 
cuatro colores solos bastan para iluminar cualquier mapa plano. 

¿Hasta qué punto puede un argumento que descansa en un cómputo 
enorme —que ningún cerebro humano sin ayuda podría comprobar— ser 
considerado una demostración? Stephen Tymoczko, un filósofo, escribió: “Si 
aceptamos el teorema de los cuatro colores como un teorema, nos vemos 
forzados a cambiar el sentido de “teorema, o más específicamente, a cambiar 
el sentido del concepto subyacente de ‘demostración ”. Pocos investigadores 
en matemáticas están de acuerdo con esto. Una razón es que existen demos- 
traciones matemáticas que no están basadas en una computadora y sin em- 
bargo son tan largas y complicadas que ni siquiera después de estudiarlas por 
una década podría alguien meter las manos al fuego y declarar que están 
totalmente exentas de errores. Por ejemplo, el llamado “teorema de clasifi- 
cación de grupos simples finitos” tiene al menos 10000 páginas, requirió los 
esfuerzos de más de cien personas y sólo un especialista bien entrenado 
puede seguirlo. Sin embargo, los matemáticos generalmente están convenci- 
dos de que la demostración es correcta. La razón es que la estrategia tiene 
sentido, los detalles cuadran entre sí, nadie ha encontrado un error serio y el 
juicio de la gente que hace el trabajo es por lo menos tan confiable como el de 
alguien no versado en el tema. Es evidente que esta convicción se desvane- 
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cería si cualquiera —conocedor o no del tema— encontrara un error, pero 
hasta ahora no ha sucedido. 

No hay nada en la demostración de Appel y Haken que sea menos convin- 
cente que el teorema de clasificación para grupos simples finitos. De hecho, es 
mucho menos probable que una computadora cometa un error a que lo haga 
un humano, siempre y cuando el programa sea correcto. La estrategia de 
demostración de Appel y Haken tiene mucho sentido desde el punto de vista 
lógico; su conjunto inevitable fue obtenido en todo caso a mano, y parece 
haber pocas razones para dudar de la exactitud del programa utilizado para 
comprobar la reductibilidad. Pruebas hechas al azar no han encontrado nada 
fuera de lugar. En una entrevista para el periódico, Haken resumió el pun- 
to de vista general: “cualquiera puede, en cualquier parte del proceso, llenar 
los detalles y verificarlos. El hecho de que una computadora pueda compro- 
bar más detalles, en pocas horas, de los que un humano podría llegar a espe- 
rar comprobar en una vida no cambia el concepto básico de demostración 
matemática. Lo que ha cambiado no es la teoría sino la práctica de las mate- 
máticas”. 


67. LA DIMENSIÓN DE HAUSDORFF Y LOS FRACTALES 
[véase página 282] 


La definición de dimensión que dio Poincaré en 1912 (véase página 284) es 
topológica y —lo que es muy razonable— conduce siempre a un valor entero. 
Un concepto de dimensión muy diferente del de Poincaré ha adquirido im- 
portancia recientemente. Fue inventado originalmente por Félix Hausdorff en 
1919 y desarrollado por A. S. Besicovitch en la década de 1930, pero después 
fue abandonado en las investigaciones matemáticas. Se ha puesto de moda 
otra vez por sus aplicaciones a la teoría de Benoît Mandelbrot de los fractales 
—objetos geométricos con estructura en todas las escalas de amplificación, 
tales como el famoso conjunto de Mandelbrot (Figura 288)—. 

Este conjunto consta de todos los números complejos c (los cuales pue- 
den representarse como puntos del plano) tales que la sucesión c, c? +c, 
(c2+c)2 +c, ... no tienda a infinito; cada término de esta sucesión es el cua- 
drado del término anterior más c. 

La dimensión Hausdorff-Besicovitch de un conjunto, con frecuencia deno- 
minada ahora la dimensión fractal, tiene muchas aplicaciones en diferentes 
ramas de la ciencia, ya que es una cantidad precisa que puede medirse experi- 
mentalmente y compararse con la teoría. Sorprendentemente, no necesita ser 
un entero. Este rasgo curioso, la razón por la que todavía tiene sentido consi- 
derar a este número como una dimensión, puede entenderse partiendo de una 
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FIGURA 288. El conjunto de Mandelbrot tiene una estructura intrincada en todas las escalas 
de amplificación. 


versión más sencilla, conocida como dimensión de reescalamiento. Algunas 
figuras pueden ensamblarse para formar copias más grandes de sí mismas. 
Por ejemplo (véase Figura 289), se requieren dos copias de un segmento de 
línea recta (un objeto unidimensional) para construir un segmento de línea 
recta del doble de tamaño; se requieren cuatro copias de un cuadrado (bidi- 
mensional) para hacer uno del doble de tamaño, y se requieren ocho copias de 
un cubo (tridimensional) para hacer uno del doble de tamaño. En general, se 
requieren 24 copias de un hipercubo d-dimensional (véase página 265) para 
hacer uno del doble de tamaño, y se requieren c = af copias para hacer uno de 
a veces su tamaño. 

Podemos resolver la ecuación c = a? para d empleando logaritmos (véase 
página 486, ecuación (6)): 

log c = d log a, 


de manera que 


a ee (6) 
loga 
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1 dimensión 2 dimensiones 3 dimensiones 
2 copias 4 copias 8 copias 


FIGURA 289. El número de copias requeridas para duplicar el tamaño de un objeto depende 
de su dimensión. 


Podemos ir ahora en el otro sentido y utilizar esta ecuación para definir d, 
dados c y a. El resultado se conoce como la dimensión de reescalamiento del 
conjunto en cuestión. Si estudiamos ejemplos, veremos que esto conduce 
a conclusiones intrigantes. Tomemos por caso el conjunto de Cantor (véase 
página 282), que puede hacerse del triple de su tamaño (a = 3) ensamblando 
dos copias (c = 2) (véase Figura 290). 

De acuerdo con la definición (6), la dimensión de reescalamiento del con- 
junto de Cantor es entonces 


log 2 
log 3 
un número real pero que no es un entero. De manera similar, el triángulo de 


Sierpiñski (Figura 291) puede duplicarse en tamaño (a = 2) ensamblando tres 
copias, de manera que su dimensión de reescalamiento es 


d= 





= 0.630923..., 








d= |8? _ 1584962... 
log 2 
Primera copia Segunda copia 
L_ ¡ — |] 


Conjunto de Cantor combinado de triple tamaño 


FIGURA 290. Dos copias del conjunto de Cantor triplican su tamaño. 
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FIGURA 291. Tres copias de un triángulo de Sierpiński doblan su tamaño. 


Esta cantidad se considera una dimensión porque toma el mismo valor que 
la dimensión común para conjuntos “bien portados” tales como intervalos, 
cuadrados, cubos, y así sucesivamente. La dimensión fractal concuerda con la 
dimensión de reescalamiento para muchos conjuntos, pero está definida para 
conjuntos que no pueden agrandarse ensamblando copias de sí mismos. Ge- 
neralmente, la dimensión fractal de un conjunto fractal no es un entero, aun- 
que a veces puede serlo; por ejemplo, en 1991, Mitsuhiro Shishikura demos- 
tró que la dimensión fractal de la frontera del conjunto de Mandelbrot es 2. El 
verdadero significado de la dimensión fractal radica en ser una medida de 
“qué tan bien es llenado el espacio por el conjunto” o “qué tan áspero es el 
conjunto”. Por ejemplo, el conjunto de Cantor, con una dimensión estricta- 
mente entre 0 y 1, llena el espacio mejor que un punto (dimensión 0) pero no 
mejor que un segmento de línea recta (dimensión 1). Así, la dimensión fractal 
resuelve la cuestión de si el conjunto de Cantor debiera tener dimensión 0 o 1 
(véase página 283) de una manera muy diferente a la propuesta de Poincaré. 


$8. Nupos 
[véase página 290] 


La teoría de nudos es actualmente el foco de una gran cantidad de actividad 
en la investigación, impulsada por el descubrimiento del polinomio de Jones, 
un nuevo método notable para distinguir nudos que no son equivalentes 
topológicamente. La teoría abarca tanto enlaces como nudos, así que comen- 
zaremos por precisar más estos conceptos. 
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Un enlace es un conjunto de una o más gazas cerradas en el espacio tridi- 
mensional. Las gazas individuales se llaman componentes del enlace. Las gazas 
pueden torcerse o anudarse, y —como el nombre sugiere—— es posible unirlas 
entre sí de cualquier manera, incluyendo el caso de no estar unidas en lo 
absoluto en el sentido convencional. Si hay sólo una gaza, el enlace se llama 
nudo. El problema central en la teoría de enlaces es encontrar modos eficien- 
tes para decidir si dos enlaces o nudos dados son o no equivalentes topológi- 
camente —es decir, si pueden deformarse uno en el otro mediante transfor- 
maciones continuas (véase páginas 275-276)—. En particular, queremos 
saber si lo que parece un nudo está en realidad desanudado, es decir, si es 
equivalente al no-nudo (Figura 292a), y si un enlace dado de n componentes 
puede ser desenlazado, es decir, si es equivalente al no-enlace de n compo- 
nentes (Figura 292b). 

La manera de lograr lo anterior es encontrando las denominadas invarian- 
tes topológicas, que son números —u objetos matemáticos más complica- 
dos— que no cambian cuando el enlace es deformado continuamente. Así, 
enlaces con invariantes distintas no deben ser equivalentes topológicamente; 
sin embargo, enlaces con las mismas invariantes pueden o no ser equivalentes, 
y la única forma de decidirlo es encontrando una equivalencia topológica o 
inventando una invariante más sensible. 

La invariante de nudo estándar en la teoría de nudos en la era anterior a 
Jones era el polinomio de Alexander, inventado en 1926. Ésta le asigna a cada 
nudo un polinomio en una variable t, que puede calcularse siguiendo un 
procedimiento estándar. No necesitamos ocuparnos aquí del procedimiento 
preciso, sino indicar el tipo de resultados que se obtienen. La Figura 293 mues- 
tra varios nudos simples y sus polinomios de Alexander. 

El polinomio de Alexander es suficientemente bueno para distinguir entre 
un nudo de trébol y un nudo de arrecife, ya que éstos tienen diferentes poli- 
nomios de Alexander, pero no es suficientemente bueno como para distinguir 
entre un nudo de arrecife y un nudo “de la abuelita”, o entre un trébol a 
izquierda y un trébol a derecha, aunque sea “obvio” experimentalmente que 


n copias 


FIGURA 292. a) el no-nudo; b) el no-enlace de n componentes. 
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Tréboles 


A izquierda A derecha 





14 —219+ 312-2t+1 


Nudo de la abuelita 





14-249 + 32 2t+1 


FIGURA 293. Algunos nudos comunes y sus polinomios de Alexander. 


540 AVANCES RECIENTES [1x] 


estos nudos no son equivalentes en realidad. El problema es, ¿cómo podemos 
demostrar esto? De 1926 a 1984, los matemáticos se esforzaron por resolver 
estas cuestiones y otras similares. Lo lograron, pero mediante métodos com- 
plicados. La teoría de nudos no llegó precisamente a estancarse pero cierta- 
mente necesitaba nuevas ideas. 

En 1984 Vaughan Jones, un neozelandés, estaba trabajando sobre cuestio- 
nes de análisis con las llamadas funciones de traza en álgebras de operadores, 
que habían surgido en relación con la física matemática. D. Hatt y Pierre de la 
Harpe se dieron cuenta de que algunas de las ecuaciones de Jones parecían 
más bien ecuaciones que tiene lugar en teoría de trenzas (las trenzas son sis- 
temas de líneas unidos, muy relacionados con los enlaces). Ponderado las 
razones que podrían estar detrás de tal coincidencia, Jones descubrió que sus 
funciones de traza podían utilizarse para definir una invariante polinomial 
para enlaces. 

En un principio se pensó que el polinomio de Jones debería ser sólo alguna 
variación del polinomio de Alexander, pero pronto se hizo claro que era ge- 
nuinamente nuevo. Posteriormente se encontraron definiciones más simples 
en las que no se recurre a álgebras de operadores. Cinco grupos separados de 
matemáticos descubrieron de manera simultánea e independiente una gene- 
ralización que era aún mejor para distinguir nudos, una fórmula de dos varia- 
bles llamada con frecuencia el polinomio HOMFLY, por los nombres de sus 
descubridores: Hoste-Ocneanu-Millet-Freyd-Lickorish-Yetter. Hoy día exis- 
ten una docena o más de nuevos polinomios de nudos que han resuelto mu- 
chos problemas notables, pero a la vez han planteado muchos rompecabezas 
nuevos por sí mismos, ya que no se adaptan cómodamente al aparato topo- 
lógico establecido. En cierto sentido, aunque los topólogos pueden calcular 
los polinomios de nudos y demostrar teoremas acerca de ellos, todavía no 
están seguros de qué son realmente estas nuevas invariantes polinomiales, 
aunque parecen tener alguna relación profunda con la física cuántica. 

El polinomio original de Jones es una invariante suficientemente poderosa 
para distinguir un trébol a izquierda de uno a derecha, lo que el polinomio de 
Alexander no podía determinar. El polinomio HOMFLY es aún más pode- 
roso, y puede distinguir un nudo de arrecife de un nudo de la abuelita. De 
hecho, si denotamos con P(L) al polinomio HOMFLY de un enlace, tenemos 


P(trébol a izquierda) = -—2x2-x4+x?2y?, 
P(trébol a derecha) = 2x7? — x4 + x7?y?, 
P(nudo de arrecife) = (—2x? — x4 + x2?y?)(—2x7? — x74 + x72y2), y 


P(nudo de la abuelita) = (—2x? — x4 + x2y2)?, 
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En estos polinomios, x y y son las dos variables requeridas para definirlos. 
Estos resultados obviamente demuestran no sólo que los dos tipos de trébol 
no son equivalentes topológicamente sino que el nudo de arrecife y el nudo de 
la abuelita tampoco lo son. 


$9. UN PROBLEMA DE MECÁNICA 
[véase página 357] 


Es éste el único caso sobre el que puede argüirse que Courant y Robbins co- 
metieron un error, aunque añadiendo más condiciones es posible salvar su 
argumento. Paradójicamente, es más fácil detectar el hueco en su demostra- 
ción si adoptamos un enfoque topológico de la dinámica, que era por lo que 
intentaba abogar el argumento de ellos. 

Repetimos el enunciado del problema. Supóngase que un tren viaja entre 
dos estaciones siguiendo una vía recta. Con una bisagra se une una varilla al 
piso de uno de los vagones, de manera que pueda moverse sin fricción ya sea 
hacia adelante o hacia atrás hasta que toque el piso (Figura 175, página 358). 
Si toca el piso, supóngase que permanece ahí durante todo el movimiento 
subsiguiente; supóngase también que de antemano especificamos cómo se 
mueve el tren. El movimiento no tiene que ser uniforme: el tren puede ace- 
lerar, detenerse repentinamente o incluso ir en reversa durante un tiempo 
determinado y debe empezar en una estación y terminar en la otra. 

Courant y Robbins preguntan si es siempre posible colocar la varilla en 
una posición tal que nunca toque el piso durante el viaje. Su solución consiste 
en hacer notar que la posición final de la varilla depende continuamente de su 
posición inicial. Como hay un rango continuo de ángulos iniciales, de 0° a 
180°, y la posición final depende continuamente de la posición inicial, el teo- 
rema de Bolzano (página 350) implica que el rango de ángulos finales tam- 
bién es continuo. Si empezamos con la varilla caída hacia adelante a 0°, ahí 
permanecerá; si empezamos con la varilla caída hacia atrás a 180%, ahí se que- 
dará. Así que el rango de ángulos finales incluye todos los valores entre 0° y 
180°; en particular incluye a 90°, así que podemos acomodar la varilla para 
que termine en posición vertical. Como la varilla se quedaría en el piso al 
tocarlo, debe evitarse que esto ocurra. 

La dificultad radica en que puede argúlirse que la suposición de continui- 
dad en la discusión anterior no está justificada. El problema no radica en lo 
sofisticado de las leyes de Newton del movimiento, sino en las “dominantes 
condiciones en la frontera”: si la varilla toca el piso, se queda ahí. Para ver por 
qué las condiciones en la frontera causan problemas, introducimos una repre- 
sentación topológica de los movimientos posibles del sistema. Este enfoque, 
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ángulo inicial ángulo inicial 


270° 0° 90° 180° 270° 270° 0° 90° 180° 270° 


` 


tiempo 








MMA 





(b) 


ErGuRA 294. Historias posibles de la varilla móvil para diferentes condiciones iniciales: 
a) sin condiciones en la frontera; b) lo que sucede cuando se imponen condiciones en la frontera. 


conocido como retrato de fase, se remonta a Poincaré. La idea consiste en 
dibujar un tipo de diagrama espacio-tiempo del movimiento, no sólo para 
una única posición inicial de la varilla sino para muchas posiciones diferentes 
—en principio, para todas—. La posición de la varilla es un ángulo entre 0° y 
360°, y la podemos graficar en la dirección horizontal (véase Figura 294). 
Dejemos que el tiempo transcurra en la dirección vertical. Nótese que los bor- 
des izquierdo y derecho de esta figura deben empatarse, ya que 0° = 360": 
conceptualmente, el rectángulo se enrolla para hacerlo un cilindro. 

Ahora, la trayectoria en el espacio y el tiempo del ángulo que determina la 
posición de la varilla forma alguna curva que corre a lo largo del cilindro —lo 
que Albert Einstein llamó una “línea de universo”—. Ángulos iniciales dife- 
rentes conducen a curvas diferentes; las leyes de la dinámica muestran que 
estas curvas varían continuamente conforme el ángulo inicial varía continua- 
mente —siempre que no se impongan las condiciones en la frontera—. Sin 
esas condiciones la varilla es libre de girar 360°: no hay piso que le impida dar 
la vuelta completa. En la Figura 294a se muestra una posible evolución, y en 
ella la posición final sí depende continuamente de la posición inicial. 

Sin embargo, si se vuelven a imponer las dominantes condiciones en la 
frontera (Figura 294b), la posición final no tiene que depender continua- 
mente de la posición inicial. Curvas que sólo rocen la frontera izquierda pue- 
den girar de regreso hasta la derecha. Ciertamente, en esta figura particular 
todas las posiciones iniciales terminan en el piso: contrario a lo que sostienen 
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Courant y Robbins, no hay una elección de posición inicial que impida que la 
varilla caiga al piso durante el movimiento completo. 

Este error en los argumentos de Courant y Robbins fue señalado por pri- 
mera vez por Tim Poston en 1976, pero todavía no es muy ampliamente co- 
nocido. La suposición de continuidad puede resucitarse imponiendo más 
restricciones al movimiento, como por ejemplo una vía perfectamente plana, 
ningún brinco en el tren y así por el estilo. Sin embargo, parece más instructi- 
vo, como un ejercicio de aplicación de la topología a la dinámica, entender 
por qué las absorbentes condiciones en la frontera destruyen la continuidad. 
Esta dificultad es importante en la dinámica topológica avanzada, en la que ha 
dado lugar al concepto de un “bloque aislante”, que es una región tal que nin- 
guna trayectoria dinámica es tangente a su frontera. 


$10. EL PROBLEMA DE STEINER 
[véase página 398] 


El problema de Steiner (página 393) se refiere a un triángulo ABC y nos pide 
que encontremos un punto P tal que minimice la distancia total PA + PB + PC. 
La respuesta, al menos cuando los ángulos del triángulo ABC son menores 
que 120", es que P es el único punto tal que las líneas PA, PB y PC se intercep- 
tan en ángulos de 120° una con la otra (páginas 393-394). El problema de 
Steiner puede generalizarse al problema de la red de caminos, el cual pide la 
red de líneas (caminos) de menor longitud total que une un conjunto dado de 
puntos (pueblos) uno al otro (página 398). Este problema generalizado ha 
dado lugar a una conjetura fascinante, sólo recientemente demostrada. 

Supóngase que queremos encontrar una red de líneas que conectarán un 
conjunto de pueblos. Una manera de hacerlo es utilizar una red llamada gene- 
radora, que utiliza sólo líneas rectas que unan pares de pueblos; otra, es usar 
una red de Steiner, en la que se permiten pueblos adicionales, de manera que 
las líneas que los unen se intercepten en ángulos de 120”. Llamemos a la longi- 
tud de la menor red generadora para un conjunto dado de pueblos longitud 
generadora y a la longitud de la menor red de Steiner, longitud de Steiner. 
El problema de encontrar la longitud de Steiner es discutido por Courant y 
Robbins (página 398) bajo el título “Problema de la red de caminos”. Obvia- 
mente la longitud de Steiner es menor que o igual a la longitud generadora. 
¿Cuánto más pequeña puede hacerse? 

Supóngase, por ejemplo, que hay tres pueblos en los vértices de un triángu- 
lo equilátero de una unidad de lado. La Figura 295 muestra la menor red de 
Steiner y la menor red generadora. El nuevo punto introducido en el centro se 
llama punto de Steiner: en general, un punto de Steiner es uno en el que tres 
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FIGURA 295. La menor red de Steiner (líneas continuas) y la menor red generadora 
(líneas interrumpidas) para tres pueblos en un triángulo equilátero. 


líneas (que lo unen con otros puntos en el conjunto de pueblos) se intercep- 
tan en ángulos de 120°. La longitud generadora es 2 y la longitud de Steiner es 
V3. En este caso, la razón entre la longitud de Steiner y la longitud gene- 
radora es V3/2 = 0.866, y el ahorro en distancia obtenido utilizando la me- 
nor red de Steiner en vez de la menor red generadora es de aproximadamente 
13.34 por ciento. 

En 1968, Edgar Gilbert y Henry Pollak conjeturaron que no importa cómo 
estén localizados los pueblos inicialmente, la longitud de Steiner nunca es 
menor que la longitud generadora en más de 13.34%; dicho de otra manera: 


longitud de Steiner _ V3 


OÓK<— a A ÁS 
longitud generadora — 2 


(7) 
para cualquier conjunto de pueblos. Esta afirmación se conoce como la conje- 
tura de la razón de Steiner. Después de un considerable esfuerzo fue final- 
mente demostrada por Ding Zhu Du y Frank Hwang en 1991; describiremos 
su procedimiento una vez que hayamos establecido las bases necesarias. 
Encontrar la longitud generadora es un cómputo sencillo, aun para un 
número muy grande de pueblos. Se resuelve mediante el algoritmo glotón: 
empezamos con la menor línea conectora que podamos hallar, y en cada etapa 
subsiguiente añadimos la menor línea que encontremos que no complete una 
figura cerrada; procedemos así hasta que todo pueblo quede incluido. Encon- 
trar la longitud de Steiner es mucho menos fácil, no pueden nada más tomarse 
todos los ternos posibles de pueblos, encontrar sus puntos de Steiner y buscar 
la menor red que una los pueblos y esté conectada ya sea en ellos o en dichos 
puntos de Steiner. Por ejemplo, supóngase que hay seis pueblos acomodados 
en las esquinas de dos cuadrados adyacentes, como en la Figura 296. Un posi- 
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(a) 


(b) 





FIGURA 296. a) Combinación de árboles de Steiner para un cuadrado y un triángulo 
rectángulo isósceles; b) un árbol de Steiner más corto para el mismo conjunto de pueblos. 


ble árbol de Steiner se muestra en la Figura 296a: se encuentra resolviendo el 
problema primero para un cuadrado de cuatro pueblos y uniendo después los 
dos pueblos restantes mediante su punto de Steiner con un pueblo que ya esté 
conectado. Sin embargo, el menor árbol de Steiner es el que se muestra en la Fi- 
gura 296b (los cuadrados con puntos negros en los vértices se incluyen sólo 
para indicar dónde están situados los pueblos). 

Por lo visto, no pueden construirse árboles de Steiner mínimos juntando 
partes. La generalización correcta de la definición de punto de Steiner a un 
conjunto de muchos pueblos es: cualquier punto en el que los enlaces puedan 
interceptarse a 120°. Para un ejemplo tan simple como el de cuatro pueblos en 
los vértices de un cuadrado, dichos puntos no son aquellos puntos de Steiner 
que conecten algún subconjunto de tres pueblos (Figura 297). Hay una infi- 
nidad de puntos en el plano, y aunque la mayoría de ellos probablemente sean 
irrelevantes, no es obvio que exista algún algoritmo; sin embargo, existen va- 
rios: el primero de ellos fue inventado por Z. A. Melzak, pero en la práctica su 
método es pesado aun para números moderados de pueblos, desde su inven- 
ción ha sido mejorado, aunque no de manera dramática. 

Sabemos ahora que hay razones claras por las que estos algoritmos son 
ineficientes. Gracias al uso creciente de las computadoras se ha creado una 
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FIGURA 297. Los puntos de Steiner (en blanco) para cuatro pueblos en un cuadrado (en 
negro) son diferentes de los puntos de Steiner de un subconjunto de tres pueblos (en gris). 


nueva rama de las matemáticas, la teoría de la complejidad algorítmica. Esta 
no sólo estudia algoritmos —métodos para resolver problemas— sino tam- 
bién la eficiencia de esos algoritmos. Dado un problema en el que interviene 
un cierto número n de objetos (aquí, pueblos), ¿cuán rápido crece el tiempo 
de ejecución de un programa para hallar la solución conforme crece n? Si el 
tiempo de ejecución no crece más rápido que un múltiplo constante de una 
potencia fija de n, tal como 5n? o 1066n1, entonces se dice que el algoritmo 
corre en tiempo polinomial y se considera que el problema es “fácil”; en gene- 
ral, esto significa que el algoritmo es factible (aunque no lo será si la cons- 
tante es verdaderamente enorme). Si el tiempo de ejecución crece de manera 
no polinomial —más rápido que cualquier múltiplo constante de potencias 
de n, por ejemplo exponencialmente, como 2” o 10”— entonces el problema 
tiene tiempo de ejecución no polinomial y se considera “difícil”. En general 
esto quiere decir que el algoritmo es totalmente impráctico. Entre el tiempo 
polinomial y el tiempo exponencial hay una maleza de problemas “mediana- 
mente fáciles” o “moderadamente difíciles” donde la factibilidad es más un 
asunto de experiencia. 

Por ejemplo, sumar dos números de n dígitos requiere a lo más 2n sumas 
de números de un dígito, incluyendo “lo que se lleva”, de manera que el tiem- 
po que toma la solución está acotado por un múltiplo constante (a saber, 2) 
de la primera potencia de n; la multiplicación larga de dos números n re- 
quiere alrededor de n? multiplicaciones de números de un dígito y no más de 
2n? sumas, o 3n? operaciones con dígitos, de manera que la cota llega ahora 
sólo a la segunda potencia de n. Estos problemas son, por lo tanto, “fáciles” 
(aunque un estudiante de primaria discreparía seguramente). En contraste 
con los ejemplos anteriores, considérese el problema del comerciante ambu- 
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lante: encontrar la ruta mínima que lleva a un comerciante por un conjunto 
dado de ciudades. Si hay n ciudades entonces el número de rutas que tenemos 
que considerar es n! = n(n — 1)(n— 2) ... 3-2- 1, que crece más rápido que 
cualquier potencia de n. Así que la numeración caso por caso es ineficiente 
más allá de toda esperanza. 

Irónicamente, el gran problema de la teoría de la complejidad algorítmica 
es demostrar que en efecto el tema existe, es decir, demostrar que algún pro- 
blema “interesante” es en efecto difícil. ¡El problema radica en que es fácil 
demostrar que un problema es fácil pero difícil demostrar que es difícil! Para 
mostrar que un problema es fácil, sólo hay que exhibir un algoritmo que lo 
resuelva en tiempo polinomial, no tiene que ser el mejor ni el más ingenioso: 
cualquiera servirá. Sin embargo, para demostrar que un problema es difícil no 
basta con exhibir algún algoritmo cuyo tiempo de ejecución sea no polinomi- 
al, ya que puede haberse escogido el algoritmo equivocado y que haya uno 
mejor cuyo tiempo de ejecución sí sea polinomial. Para eliminar esa posibili- 
dad, hay que encontrar algún modo matemático de considerar todos los algo- 
ritmos posibles para el problema y mostrar que ninguno de ellos tiene tiempo 
de ejecución polinomial, lo cual es extremadamente difícil. 

Hay muchos candidatos a problemas difíciles: el problema del comerciante 
ambulante, el problema de la alacena (¿cómo puede acomodarse mejor un 
conjunto de objetos de dimensiones dadas en un conjunto de anaqueles de di- 
mensiones dadas?) y el problema de la mochila (dada una mochila de dimen- 
siones fijas y muchos objetos, ¿hay algún conjunto de objetos que llene exac- 
tamente la mochila?). Hasta ahora nadie ha conseguido demostrar que alguno 
de ellos sea difícil. Sin embargo, Stephen Cook, de la Universidad de Toronto, 
mostró en 1971 que si se puede demostrar que cualquier problema de este 
grupo de candidatos es en efecto difícil, entonces todos lo son; es decir, se pue- 
de “cifrar” cualquiera de ellos para que sea un caso especial de uno de los otros: 
o todos tienen éxito o todos fallan. Estos problemas se llaman NP-completos, 
donde NP quiere decir no polinomial. Todo mundo cree que los problemas 
NP-completos realmente son difíciles, pero esto nunca ha sido demostrado. 

La completividad polinomial se relaciona con el problema de Steiner gra- 
cias a que Ronald Graham, Michael Garey y David Johnson han demostrado 
que el problema de computar la longitud de Steiner es NP-completo. Es decir, 
cualquier algoritmo eficiente para encontrar la longitud de Steiner precisa 
para cualquier conjunto de pueblos conduciría automáticamente a soluciones 
eficientes de todo tipo de problemas de cómputo de los que generalmente se 
cree que no poseen tales soluciones. 

La conjetura de la razón de Steiner (7) es entonces importante, pues de- 
muestra que podemos reemplazar un problema difícil por uno fácil sin perder 
mucho. Gilbert y Pollak tenían demasiada evidencia positiva cuando enun- 
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ciaron esta conjetura. Específicamente, podían demostrar una afirmación un 
poco más débil: la razón entre la longitud de Steiner y la longitud generadora 
es siempre al menos 0.5. Para 1990 varias personas habían llevado a cabo 
cálculos heroicos para verificar por completo la conjetura para redes de 4, 5 
y 6 pueblos; para arreglos generales de tantos pueblos como se quiera, ele- 
varon los límites de dicha razón de 0.5 a 0.57, 0.74 y 0.8. Alrededor de 1990 
Graham y Fang Chung la elevaron a 0.824, mediante un cómputo que descri- 
bieron como “realmente horrible —estaba claro que no se trataba del enfoque 
adecuado—”. 

Para hacer posible el progreso ulterior, tenían que simplificarse los cálculos 
“horribles”. Du y Hwang encontraron una vía mucho mejor: eliminar por 
completo los cálculos engorrosos. La cuestión básica es cómo hacer que apa- 
rezcan triángulos equiláteros en escena. Hay un gran salto desde el ejemplo 
del triángulo en la Figura 295, que marca la cota de la razón entre la longi- 
tud de Steiner y la longitud generadora, a un sistema general de pueblos, que 
se supone que tiene que respetar la misma cota. ¿Cómo remontar ese vacío? 
Hay una especie de punto de apoyo intermedio. Imaginemos el plano teselado 
con triángulos equilíteros idénticos, formando una celosía triangular (Figura 
298). Colóquense pueblos sólo en los vértices de las piezas de la teselación. 
Resulta que los únicos puntos de Steiner que necesitan ser considerados son 
los centros de las piezas. En pocas palabras, se tiene mucho control, no sólo en 
los cómputos sino en los análisis teóricos. 





FIGURA 298. Una red de Steiner para pueblos que están en los vértices de una celosía trian- 
gular tiene una estructura mucho más rígida y regular que el caso general. Du y Hwang 
reducen la conjetura de la razón de Steiner al mismo problema para redes sobre celosías. 
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Por supuesto que no todo conjunto de pueblos se acomoda de manera 
conveniente a una celosía triangular; la creatividad de Du y Hwang consistió 
en darse cuenta de que los cruciales sí lo hacen. Otra vez la demostración 
es indirecta, por contradicción. Supóngase que la conjetura es falsa, enton- 
ces debe existir un contraejemplo: algún conjunto de pueblos para el cual la 
razón sea menor que V3/2. Du y Hwang muestran que si existe un contra- 
ejemplo a la conjetura debe ser uno para el que todos los pueblos queden en 
una celosía triangular, lo que introduce un elemento de regularidad en el pro- 
blema, y a partir de ahí es relativamente sencillo completar la demostración. 

Para demostrar esta propiedad de las celosías, Du y Wang reformulan la con- 
jetura como un problema en la teoría de juegos, donde los jugadores compiten 
tratando de limitar las ganancias de sus oponentes. La teoría de juegos fue 
inventada por John von Neumann y Oskar Morgenstern en su obra clásica, 
Theory of Games and Economic Behavior, de 1947. En la versión de Du y Hwang 
de la conjetura de la razón de Steiner un jugador selecciona la “forma” gene- 
ral del árbol de Steiner y otro escoge el árbol más corto que pueda encontrarse 
con esa forma. Du y Hwang deducen la existencia de una celosía que sirve de 
contraejemplo observando que la ganancia de su juego tiene una propiedad 
especial de “convexidad”. 


$11. PELÍCULAS DE JABÓN Y SUPERFICIES MÍNIMAS 
[véase página 425] 


En el capítulo VII, $11, se menciona varias veces la observación de que cuan- 
do tres películas de jabón se interceptan parecen formar ángulos de 120°, rela- 
cionando este fenómeno con el problema de Steiner (página 393). Se da un fe- 
nómeno similar cuando cuatro superficies de película de jabón se interceptan 
en un punto común, como sucede en la Figura 240, página 426: experimen- 
talmente, el ángulo formado en la esquina de cada superficie es cercano a 
109%, siendo éste el valor del ángulo formado por cuatro planos que se inter- 
ceptan en el centroide de un tetraedro, como en la Figura 299; de paso, esto 
implica que el pequeño “cuadrado” central de la Figura 240 no es de hecho un 
cuadrado, lo que explica por qué las trece superficies en el armazón cúbico 
están ligeramente curvadas. 

Estas reglas generales acerca de ángulos fueron registradas por primera vez 
por Plateau, quien estableció tres principios acerca de la forma que adquieren 
las películas de jabón en armazones: 

1) Constan de un número finito de superficies planas o suavemente cur- 
vadas, unidas entre sí de manera fluida. 

2) Esas superficies se interceptan sólo de dos maneras: o exactamente tres 
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de ellas se interceptan a lo largo de una curva suave, o cuatro se interceptan en 
un punto. 

3) Cuando tres superficies se interceptan, los ángulos entre ellas son de 
120%; y cuando se interceptan cuatro, los ángulos que se forman en las esqui- 
nas son aproximadamente de 109°. 

En 1976, Frederick Almgren y Jean Taylor demostraron que estas tres pro- 
piedades surgen todas de un mismo principio matemático, sobre el que se 
fundamenta lo expuesto en $11 del capítulo VII: la película de jabón toma 
cualquier forma que minimice el área total. Tal vez sorprenda saber que, de los 
principios de Plateau, el más difícil de establecer es el primero, de carácter 
más cualitativo: que la figura consta de un número finito de superficies. Los 
otros dos principios se siguen de una manera relativamente fácil de argumen- 
tos geométricos, exactamente igual que el ángulo de 120° en el problema de 
Steiner. Primero explicamos esta deducción y después discutimos la demos- 
tración del primer principio de Plateau. 

El paso inicial en la deducción de los principios segundo y tercero a partir 
del primero consiste en utilizar el hecho de que las superficies son casi planas 
para reducir el problema a uno acerca de planos. Si se aumenta una región 
muy pequeña cerca de una línea de intersección de tres superficies o de un 
punto de intersección de cuatro, las superficies aparecen casi planas, y entre 
mayor sea la amplificación, más planas parecen ser. Considerando el grado de 
error que implica tal aproximación, resulta ser suficiente demostrar los prin- 
cipios segundo y tercero de Plateau bajo la suposición simplificadora de que 
las superficies son planas. El segundo paso es reducir esta cuestión a una refe- 
rente a líneas sobre una esfera. Considérese la forma en que las regiones 
planas se intersecan con una esfera con centro en la línea o punto de intersec- 
ción. El sistema de planos es entonces reemplazado por un sistema de arcos de 


FIGURA 299. Superficie mínima en un armazón con forma de tetraedro: 
cuatro superficies se interceptan en el punto central, formando ángulos de 109°. 
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FIGURA 300. La reducción de la geometría de un sistema de planos a la de un sistema de arcos. 


círculos máximos (véase Figura 300). El requerimiento análogo al de área 
mínima es que la longitud total de estos arcos debe ser mínima. Por una ver- 
sión esférica del teorema de Steiner (página 393), demostrada de manera si- 
milar, los arcos se interceptan de tres en tres, en ángulos de 120°. El tercer paso 
es demostrar que precisamente diez configuraciones diferentes de arcos de 
círculos máximos satisfacen estas condiciones (Figura 301). El cuarto paso es 
tomar cada una de tales configuraciones y realizar una búsqueda de pequeñas 
deformaciones de la configuración correspondiente de superficies planas 
—posiblemente introduciendo nuevas piezas— que reduzcan el área total 
dentro de la esfera. Si cualquiera de esas reducciones de área es posible, la con- 
figuración correspondiente de arcos puede eliminarse: no corresponde a un 
arreglo de superficies de área mínima. (En la práctica, varios de estos casos 
fueron estudiados haciendo los armazones de alambre correspondientes y 
observando las formas que tomaba la película de jabón para deducir la forma 
general de la pequeña deformación que ocurría. Entonces la posibilidad de 
reducir el área se establecía de manera rigurosa haciendo estimaciones ade- 
cuadas.) Exactamente tres configuraciones sobrevivieron a este proceso: un 
solo círculo máximo, tres semicírculos que se interceptan en ángulos de 120° y 
cuatro arcos que forman un tetraedro curviliíneo —números 1 a 3 en la Figu- 
ra 301—. Las configuraciones planas correspondientes son una sola superficie 
que no intercepta a ninguna otra, tres superficies que se interceptan en ángu- 
los de 120° o cuatro superficies que se interceptan en ángulos de 109°. Los 
principios segundo y tercero de Plateau son inmediatos. 

Todo depende así de demostrar que la forma mínima consta de un número 
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FIGURA 301. Las diez configuraciones de arcos que se encuentran en ángulos de 120°. 
FUENTE: Scientific American 235, núm. 1 (julio de 1976), pp. 90-91. 
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finito de muchas superficies, para lograrlo, es necesario pensar en la posibili- 
dad de que existan formas más complejas, y esto a su vez requiere la gene- 
ralización del concepto de área para estas formas más complejas. El problema 
entonces se divide en dos etapas separadas: primera, demostrar la existencia 
de alguna forma compleja que minimice esta área generalizada, y segunda, 
usar la propiedad de minimalidad para mostrar que la forma compleja en reali- 
dad es bastante simple, y que está compuesta por un número finito de muchas 
superficies suaves. 

Las técnicas para hacer que estas dos etapas funcionen son nuevas y abstrac- 
tas; pertenecen a un área conocida como “teoría geométrica de la medida” 
—la misma área a la que pertenece la definición de dimensión fractal—. 
A grandes rasgos, cualquier superficie particular S es reemplazada por una 
“medida” asociada, una función que asigna a cualquier región X del espacio el 
área de aquella parte de S que queda dentro de X. Formas más complejas son 
representadas por funciones con propiedades similares a estas medidas ba- 
sadas en superficies. La ventaja de reemplazar formas por medidas es que las 
medidas tienen propiedades mucho más agradables: por ejemplo, pueden 
sumarse o definirse como el límite de sucesiones de otras medidas, opera- 
ciones difíciles de definir directamente para formas geométricas. 

La existencia de una medida que minimiza resulta ser entonces un argu- 
mento directo en la teoría geométrica de la medida. La parte más difícil del 
argumento es mostrar que toda medida que minimiza corresponde a un sis- 
tema finito de superficies suaves. Irónicamente, el conocimiento acerca de 
cómo se unirían estas superficies si realmente fueran tales —los principios 
segundo y tercero de Plateau— ayudaron a Almgren y Taylor a idear cómo 
demostrar que en efecto son superficies. Sabiendo de antemano cuál “debería 
ser” la respuesta, con frecuencia hace más fácil encontrar una demostración. 


912. ANÁLISIS NO ESTÁNDAR 
[véase página 474] 


En la página 476 Courant y Robbins subrayan que “las “diferenciales” como 
cantidades infinitamente pequeñas están ahora descartadas definitiva y des- 
honrosamente”: una reflexión precisa del punto de vista que se tenía por con- 
senso cuando se escribió ¿Qué son las matemáticas? A pesar del veredicto de 
Courant y Robbins, siempre ha habido algo intuitivo y llamativo en los argu- 
mentos a la antigua con infinitesimales. Están aún sumergidos en nuestro 
lenguaje en ideas tales como “instantes” de tiempo, velocidades “instantáneas” 
y el considerar a una curva como una serie de líneas rectas infinitamente pe- 
queñas y al área acotada por una curva como suma de una cantidad infinita 
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de áreas de rectángulos infinitesimales. Este tipo de intuición resulta estar jus- 
tificado, pues se ha descubierto recientemente que el concepto de cantidades 
infinitamente pequeñas no es deshonroso y no tiene por qué ser descartado. 
Es posible establecer un marco riguroso para el análisis en el que las defini- 
ciones weierstrassianas en términos de épsilon y delta (véase página 341) sean 
reemplazadas por enunciados sobre infinitesimales, que son increíblemente 
similares a las ideas intuitivas de Leibniz, Newton y Cauchy. 

La manera de volver respetables a los infinitesimales se llama análisis no es- 
tándar y es perfectamente viable como una alternativa al enfoque en términos 
de épsilon y delta, pero por varias razones —sólo una de las cuales es el conser- 
vadurismo científico— la mayoría de los matemáticos aún prefieren el punto 
de vista de Weierstrass. El gran problema psicológico es que para establecer tal 
marco se requieren ideas sofisticadas de la lógica matemática moderna. Más o 
menos de 1920 a 1950 hubo un desarrollo explosivo de la lógica matemática 
en el que uno de los temas que surgieron fue la teoría de modelos, que cons- 
truye y caracteriza modelos de sistemas de axiomas: estructuras matemáticas 
que obedecen esos axiomas; así, el plano coordenado es un modelo para los 
axiomas de la geometría euclidiana, el disco de Poincaré (página 258) es un 
modelo para los axiomas de la geometría hiperbólica, y así sucesivamente. 

Hay un sistema de axiomas estándar para los números reales, y se sabe des- 
de hace mucho que hay un modelo único, los números reales estándares R, 
razón por la cual diferentes maneras de construir “los” números reales (véan- 
se páginas 94-95) conducen a sistemas de números que son efectivamente 
idénticos. Además, R no contiene ningún infinitesimal ni ningún infinito. Así 
que, ¿cómo es posible aplicar la teoría de modelos para construir un sistema 
de números reales “no estándar” que sí contenga estos objetos extraños? Los 
lógicos distinguen entre sistemas axiomáticos de “primer orden” y de “segundo 
orden”. En una teoría de primer orden los axiomas expresan propiedades que 
se requiere que cumplan todos los objetos en el sistema, pero no todos los 
conjuntos de objetos. En una teoría de segundo orden no hay tal restricción. 
En la aritmética ordinaria, un enunciado tal como 


x+y=y+x para todo x y y (8) 


es de primer orden, y así lo son todas las leyes comunes del álgebra; sin em- 
bargo, el “axioma arquimediano” 


À 1 A 
si |x| < — para todos los números naturales n entonces x = 0 (9) 
n 


es de segundo orden. La mayoría de los axiomas comunes para los números 
reales son de primer orden, pero la lista incluye algunos que son de segundo 
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orden. De hecho, el axioma de segundo orden (9) es el crucial que excluye de 
R tanto a los infinitesimales como a los infinitos. No obstante, resulta que si se 
debilitan los axiomas de manera que consten sólo de las propiedades de pri- 
mer orden de R entonces existen otros modelos, incluyendo algunos que 
violan la propiedad (9) anterior. Sea R* un modelo tal y llamémoslo el siste- 
ma de los números hiperreales. Esta idea, la base del análisis no estándar, fue 
descubierta por Abraham Robinson alrededor de 1960. Ya hemos visto que 
hay geometrías no euclidianas y teorías de conjuntos no cantorianas, ahora 
encontramos que hay sistemas de números no arquimedianos. 

El conjunto R* contiene varios subconjuntos importantes: hay un conjun- 
to de números naturales “estándares”, N = (1, 2, 3, ...}, y hay también un sis- 
tema más amplio de números naturales “no estándares” N*; están los enteros 
estándares Z y una extensión correspondiente a los enteros no estándares Z*; 
están los racionales estándares Q y una extensión correspondiente a los ra- 
cionales no estándares Q*; hay reales estándares R y reales no estándares 
(o hiperreales) R*. 

Toda propiedad de primer orden de R tiene una única extensión natural a 
R*. Sin embargo, (9) expresa una propiedad de segundo orden, y ésta es falsa 
en R*. Los hiperreales contienen infinitos e infinitesimales verdaderos. Por 
ejemplo, x € R* es infinitesimal si y sólo si x # 0 y |x| < 1/n para todo n€ N.? 
El argumento usual de que “los infinitesimales no existen” demuestra en reali- 
dad que los infinitesimales reales no existen, es decir, que los infinitesimales en 
R* no pertenecen a R. Pero eso es completamente razonable, ya que R* es más 
grande que R. Dicho sea de paso, el análogo “correcto” de (9) en R* es 


1 
si|x|< — para toda n E N* entonces x = 0, (10) 
n 


y éste es verdadero. Así que cambiar (9) para referirnos a los números natu- 
rales no estándares en vez de a los estándares hace una gran diferencia. 

La extensión de reales a hiperreales es sólo un ejemplo más del antiguo 
juego de extender el sistema de números para que se cumpla una propiedad 
deseada (véanse páginas 77 a 118). Por ejemplo, los números racionales 
fueron extendidos a los reales para permitir que 2 tenga una raíz cuadrada, y 
los números reales fueron extendidos a los números complejos para permitir 
que —1 tenga una raíz cuadrada. Entonces, ¿por qué no extender los números 
reales a los números hiperreales para permitir que existan los infinitesimales? 

Podemos usar R* para demostrar teoremas acerca de R, ya que los sistemas 
de números R y R* son indistinguibles en lo que se refiere a sus propiedades de 


t Vale la pena hacer notar que el autor de esta sección presenta un modelo R* de números 
hiperreales en el que el cero no es un infinitesimal. (N.T.; N.E.] 
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primer orden. Sin embargo, R* tiene todo tipo de rasgos distintivos nuevos, 
como la presencia de infinitesimales e infinitos, que pueden explotarse de 
maneras novedosas. Estos nuevos rasgos distintivos son propiedades de se- 
gundo orden, y es por eso que los nuevos sistemas pueden tenerlas aunque los 
viejos no. Observaciones similares se aplican a los subsistemas N y N*, Z y Z* 
y QyQ*. 

Unas pocas definiciones darán el sabor de este enfoque. Un número hipe- 
rreal es finito si [su valor absoluto] es menor que algún real estándar; es infi- 
nitesimal si [su valor absoluto] es menor que todos los reales estándares posi- 
tivos. Algo que no sea finito es infinito, y algo que no esté en R es no estándar. 
Si x es infinitesimal entonces 1/x es infinito, y viceversa. 

Nada de esto sería de gran importancia si todo lo que pudiera hacerse fuese 
inventar un nuevo sistema de números. Sin embargo, aunque R y R* son dife- 
rentes, están íntimamente relacionados. De hecho, todo hiperreal finito x tie- 
ne una parte estándar única std(x) que está infinitamente cercana a x, es decir, 
x — std(x) es infinitesimal. En otras palabras, cada hiperreal finito tiene una 
expresión única como “real estándar más infinitesimal”. Es como si cada real 
estándar estuviera rodeado por una nube de hiperreales infinitamente cer- 
canos, con frecuencia llamada su halo. Cada uno de tales halos rodea a un úni- 
co real, que por alguna oscura razón se suele llamar su sombra, aunque una 
palabra como “núcleo” o “centro” transmitiría mejor la imagen de lo que se 
quiere decir. Usando la parte estándar podemos transferir propiedades de R* 
a Ro viceversa. 

Para ver cómo difieren las demostraciones en el análisis no estándar de sus 
contrapartes estándares, considérese el cálculo de Leibniz de la derivada de la 
función y = f(x) = x?. Lo que él hace es tomar un número pequeño Ax y for- 
mar la razón (f(x + Ax) — Ax)]/Ax. (El acercamiento de Newton fue básica- 
mente el mismo, excepto que usó el símbolo o en lugar de Ax). Siguiendo a 
Leibniz, calculemos: 


f(x+Ax)~ f(x) (x+ Ax)? — x? 
Ax > Ax 


_ x? +2xAx + (Ax)? — x? 
E Ax 


_ 2xAx + (Ax)? 
_ Ax 


=2x+Ax. 
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Leibniz arguyó que como Ax es infinitesimal, puede ignorarse, dejando sólo 
2x. Sin embargo, Ax debe ser distinto de cero para que [f(x + Ax) — f(x)]/Ax 
tenga sentido, y en tal caso 2x + Ax no es igual a 2x. Fue esta dificultad la que 
llevó al obispo George Berkeley a escribir su famosa crítica The Analyst, 
Or a Discourse Addressed to an Infidel Mathematician [1734], en la que señaló 
algunas inconsistencias lógicas en los fundamentos del cálculo. 

Weierstrass superó las objeciones de Berkeley añadiendo un paso final: 
tomar el límite cuando Ax tiende a cero. (Tanto Leibniz como Newton habían 
expresado ideas similares, pero no con la misma claridad cristalina que en tér- 
minos de las e y 8 de Weierstrass.) Como valores de Ax distintos de cero 
pueden tender a cero, podemos suponer que todos los valores de Ax que 
aparecen durante el cálculo son distintos de cero, de manera que dividir entre 
Ax tenga sentido. Entonces tomamos el límite cuando Ax > 0 para deshacer- 
nos del embarazoso terminó adicional Ax y dejar la respuesta requerida 2x. 

En el análisis no estándar hay una manera más sencilla: tómese x finito y 
estándar (es decir, sea x E R) y supóngase que Ax es un infinitesimal genuino. 
En lugar de 2x + Ax tómese su parte estándar std(2x + Ax), que es 2x. En otras 
palabras, defínase la derivada de f(x) como 


sl LEER, 


donde x es un real estándar y Ax cualquier infinitesimal.f La idea aparente- 
mente inocente de tomar la parte estándar es exactamente lo que se necesita 
para hacer que la derivada sea una función real de x en vez de una función 
hiperreal de x y Ax, lo cual es una manera perfectamente rigurosa de quitar el 
término Ax, pues std(x) es un real definido de manera única. En lugar de ba- 
rrer abajo del tapete al Ax adicional con tantos argumentos especiosos, es ele- 
gantemente borrado. 

Un curso de análisis no estándar parece un prolongado alarde de exacta- 
mente aquellos errores en los que Courant y Robbins gastaron tantas páginas 
enseñándonos a evitar. Por ejemplo: 

1. Una sucesión s„ converge a un límite L si s — L es infinitesimal para 
todo infinito w. (Compárese con la página 327.) 

2. Una función f es continua en x si f(x + £) está infinitamente cercano a 
f(x) (es decir, f(x + e) — f(x) es infinitesimal) para todo infinitesimal e. (Com- 
párese con la página 347.) 

3. La función f tiene derivada d en x si y sólo si [f(x + Ax) — f(x)]/Ax está 
infinitamente cercano a d para todos los infinitesimales Ax. (Compárese con 
la página 456.) 


t Véase la nota de la página 565. 
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4. El área de una región limitada por una curva es una suma de una infini- 
dad de rectángulos infinitesimales. (Compárese con la página 443.) 

Sin embargo, en el marco del análisis no estándar estos enunciados pueden 
dotarse de un sentido riguroso. 

De hecho, el análisis no estándar no conduce a ninguna conclusión acerca 
de R que difiera del análisis estándar. Es fácil concluir de ahí que no tiene sen- 
tido usar el enfoque no estándar, ya que “no conduce a nada nuevo”. Pero esta 
crítica no es concluyente, la pregunta no es: “¿da los mismos resultados?” sino 
más bien: “¿es una manera más sencilla o más natural de obtener esos resulta- 
dos?” Como Newton mostró en su Principia, todo lo que puede demostrarse 
con cálculo puede también demostrarse con geometría clásica, lo cual no 
implica de manera alguna que el cálculo no sirva, y lo mismo vale para el aná- 
lisis no estándar. 

La experiencia sugiere que las demostraciones por medio del análisis no 
estándar son generalmente más cortas y más directas que las demostraciones 
clásicas en términos de épsilon y delta, lo cual se debe a que evitan estima- 
ciones complicadas de los tamaños de las cosas, estimaciones que constituyen 
el grueso de una demostración clásica. El obstáculo principal para la adopción 
generalizada del análisis no estándar es que para saber apreciarlo se requiere 
una formación que incluya conocimientos de lógica matemática —muy dife- 
rente del análisis tradicional—. 
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Criba de Eratóstenes, 32, 
Cuadrantes, 82. 
Cuadrática, ecuación, 110, 101. 
Cuadráticos, restos, 46, 47. 
Cuadratura del círculo, 152. 
Cuádricas, superficies, 224-26. 
Cuadrilátero completo, 191, 192. 
Cuatro colores, problema de los, 258-60. 
Cuerpo, 64. 
ampliado, 140. 
Cuerpos numéricos: 
álgebra de los, 127-52. 
construcción geométrica de, 131-38. 
Curva, longitud de un arco de, 476-79. 
Curvas: 
de nivel, 298, 
ecuaciones de, 83-85. 
Curvatura media, 396. 


De Moivre, fórmula de, 105, 107-10. 
Decágono regular, construcción del, 133. 
Decimales: 
de infinitas cifras, 69-71. 
fracciones, 67-71. 
Dedekind, cortadura de, 80, 81. 
Deformaciones, 254. 
Delta (A), 412. 
Densidad de los números racionales, 66. 
Dependiente, variable, 287. 
Derivación, 427, 432, 437-43, 472-74. 
Derivada, 424-43. 
segunda, 435. 
Desargues, teorema de, 182-841, 
200. 
Descomposición única en factores pri- 
mos, 30, 54, 55. 
Desigualdades, 10, 11, 22, 23, 65, 66, 
104, 333, 371-76, 511. 
Diádico, sistema, 16. 
Diferencial, cociente, 444. 
Diferenciales, 443-45. 
ecuaciones, 464-71. 
Dimensión, 260-64. 
Dinámica de Newton, 469-71. 
Diofánticas, ecuaciones, 57-59. 
Dirichlet, principio de, 377. 
Discontinuas, funciones, como límites 
de funciones continuas, 336, 337, 


199, 
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Discontinuidad: 
de una función, 295-97. 
finita, 295. 
Distancia, 82, 327. 
Distancias extremales 
dada, 247-49. 
Distributiva, ley: 
en los conjuntos, 120. 
en los números naturales, 9. 
en los números racionales, 62. 
Divergencia: 
de series, 482. 
de sucesiones, 305, 
Dominio: 
de una variable, 285. 
simplemente conexo, 255. 
Dualidad, principio de: 
en el álgebra de los conjuntos, 122. 
en geometría, 203, 205-09, 221, 229. 
Duodecimal, sistema, 13, 14. 
Duplicación del cubo, 127, 146, 147, 
158. 


a una curva 


e, número de Euler, 308-10. 
como base de los logaritmos natura- 
les, 455. 
en forma de límite, 458-60. 
expresiones del, 309. 
irracionalidad del, 310, 314, 
École Politechnique, 179. 
Ecuación: 
ciclotómica, 109. 
cuadrática, 100. 
de la circunferencia, 83. 
de la elipse, 84, 504, 
de la hipérbola, 84, 504. 
de la recta, 83, 500-02. 
de una curva, 83-85. 
diofántica, 57, 59. 
multiplicidad de raíces, 111. 
raíces, 110. 
Ecuaciones: 
algebraicas, 110-12- 281-83. 
del movimiento, 469-71. 
Ejes: 
de las cónicas, 83-85. 
en coordenadas cartesianas, 81. 
Elipse: 
ecuación de la, 84. 
propiedades de las tangentes a la, 
344, 345. 
Elíptica, geometría, 237-39. 
Elípticos, puntos, 238. 
Emplírica, inducción, 17. 
Entero, principio del menor, 26, 


Enteros: 
negativos, 63. 
positivos, 8-17. 

Epicicloide, 167. 

Equivalencia de conjuntos, 86. 

Eratóstenes, criba de, 32. 

Ergódico, movimiento, 363, 364. 

Erlanger, programa de, 170. 

Estacionarios, puntos, 352-56. 

Euclides, algoritmo de, 50-59. 

Euler: 
características de, 248-53, 270, 274. 
función ọ de, 55-57. 

Excentricidad (en las cónicas), 84. 

Exclusión de la división por cero, 64, 
100. 

Existencia: 
matemática, 97. 
pruebas de, 95, 376-83. 

Exponencial, función, 456, 457, 459, 460. 
ecuación diferencial de la, 464-67. 
orden de magnitud de la, 479, 480. 

Extracción geométrica de la raíz cuadra- 
da, 133. 


Factorial de n, 25. 
Fermat: 
números de, 33, 129, 
principio de, 390-93. 
teorema de, 44-46, 57. 
último teorema de, 48-50. 
Focos de-la cónica, 84. 
Formalismo, 97, 227. 
Fracciones: 
continuas. 57-59, 312-14. 
decimales, 69-71. 
Función: 
compuesta, 293, 294. 
continuidad de una, 294-97, 299, 338, 
339, 
convexa, 510. 
de variable compleja, 489, 490. 
de varias variables, 297-300, 
definición, 286. 
gráfica, 290. 
inversa, 290-93. 
monótona, 292. 
primitiva, 448. 
Fundamentos de la matemática, 97 


Generalización, proceso de, 64. 
Género de una superficie, 268-70, 274. 
Geodésicas, 238. 

en una esfera, 394, 395. 
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Geometría analítica, 81-85, 203-09, 498- 
504, 
axiomas en, 226-30. 
combinatoria. 242-46. 
de n dimensiones, 240-42. 
de Riemann, 237-39. 
elemental, problemas extremales de, 
341-49. 
elíptica, 237-39. 
hiperbólica, 230-37. 
inversión, 153-58, 170-76. 
métrica, 181. 
no euclidea, 230-37. 
proyectiva, 177-226. 
sintética, 177. 
teoría de las construcciones en, 127- 
76, 209, 210. 
topología, 247-83. 
Geométrica: 
media, 371-74. 
progresión, 20, 21. 
serie, 74. 
Geométricas: 
construcciones, teoría de las, 127-76. 
transformaciones, 153, 177-79. 
Goldbach, conjetura de, 38. 
Gráfica de una función, 290. 
Griegos, tres clásicos problemas, 127, 
146-52. 
Grupo, 180. 


Hart, inversor de, 169. 
Haz de rectas, 216. 
Heptágono regular, imposibilidad de su 
construcción, 151. 
Herón, teorema de, 341-43. 
Hexágono regular, construcción del, 
134. 
Hipérbola: 
ecuación de la, 84. 
propiedades de las tangentes a la, 
345-47. á 
Hiperbólica, geometría, 230-37. 
Hiperbólicas, funciones, 514, 515. 
Hiperbólico, paraboloide, 298. 
Hiperbólicos, puntos, 238. 
Hiperboloide, 224-26. 
Hipocicloide, 166. 
Hipótesis del continuo, 97. 
Homogéneas, 205-09. 


Ideales, puntos, en geometría proyec- 
tiva, 192-97. 
Iluminación de mapas, 258-60, 276-79. 


Imagen, punto (de la representación), 
153. 
Imaginarios, números (véase Complejos, 
números). 
Imposibilidad de los tres problemas 
griegos, 146-52. 
demostraciones de, 131-52. 
Incidencia, 181, 182. 
Inconmensurables, segmentos, 66-69. 
Indefinida, fracción continua, 313. 
Indefinidas, progresiones geométricas, 
71-75. 
Independiente, variable, 287, 
Indirecta, prueba, 95, 96. 
Inducción: 
empírica, 17. 
matemática, 17-27. 
Infinitamente pequeños, 443-45. 
Infinitas, series, 482-87. 
Infinito, 65, 86-97. 
análisis del concepto matemático, 
86-97. 
punto del (en la inversión), 154. 
puntos del (en geometría proyectiva), 
192-97. 
Infinitos, productos, 311, 491-93. 
Infinitud: 
de los números primos, 29, 33, 34, 
491. 
órdenes de, 479-82. 
Integral, 409-24, 474, 475, 515-20. 
Interés compuesto, 467. 
Intersección de conjuntos, 120. 
Intervalo, 65. 
Intervalos, encajes de, 76-79. 
Intuicionismo, 96, 227. 
Invariancia, 177-79. 
de ángulos en la 
171. 
de la razón doble, 185, 186. 
Inversas: 
funciones, 290-93. 
operaciones, 11. 
Inversión, 153-58, 170-76. 
Inversores, 167-70. 
Inversos, puntos, 154. 
construcción de, 156, 157. 
Irracionales, números: 
como decimales infinitos, 71. 
definidos por cortaduras, 80. 
definidos por encajes de intervalos, 
76-80. 
definidos por sucesiones, 81. 
Iscperímetros, problema de los, 383- 
386. 
Iteración, límites por, 337, 338. 


inversión, 170, 
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Jordán, teorema de la curva de, 257, 
258, 279-81. 


Klein: 
botella de, 274. 
modelo de, 232-34. 


Leibniz, fórmula para v de, 451. 
Límites, 301-32. 

de las series geométricas, 73, 74. 

de una sucesión, 301-14. 

ejemplos, 333-38. 

por aproximación continua, 314-23. 

por iteración, 337, 338. 
Liouville, teorema de, 113-17. 
Logaritmo. 

(nt), orden de infinitud, 481, 482, 

natural, 36, 453-56, 460-64, 479, 480. 
Lógica: 

matemática, 97, 122-24. 

suma, 120. 
Lógico, producto, 120. 
Longitud de una curva, 475-79. 
Luminosos: 

propiedad extremal de Jos rayos, 

341-43. 
triángulos formados por rayos, 362, 
363. 


Mapa regular, 276. 
Mapas, iluminación de, 258-60, 276-79. 
Mascheroni, construcciones de, 159-63. 
Matemática: 
existencia, 97. 
inducción, 17-27. 
lógica, 97, 122-24. 
Máximo común divisor, 51-53. 
Máximos y mínimos, 340-407, 436, 437, 
442. 
Mecánicos, instrumentos, trazado con, 
164-67. 
Media: 
aritmética, 371-74. 
geométrica, 371-74. 
Medias, desigualdades entre, 372-74. 
Menor entero, principio del, 26. 
Metamatemática, 97. 
Métrica, geometría, 181. 
Mínimos: 
método de los cuadrados, 374-76. 
puntos, 353-56. 
Módulo: 
d, 39, 
de un complejo, 102. 
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Moebius, cinta de, 272-75. 
Monótona: 
función, 292. 
sucesión, 306-08. 
Morse, relaciones de, 356. 
Movimiento: 
ecuaciones de, 467-71. 
ergódico, 363, 364. 
rígido, 164. 
Multiplicidad de raíces en la ecuación 
algebraica, 11. 


n dimensiones, geometría de, 240-42. 
Naturales, números, 8-27. 
Negativos, números, 63, 
Newton, dinámica de, 469-71. 
Nivel, curvas de, 298. 
No euclidea, geometría, 230-37. 
No-numerabilidad del continuo numé- 
rico, 89-91. 
Nudos, 268. 
Numerabilidad de los números racio- 
nales, 87-89. 
Números: 
algebraicos, 112, 113. 
cardinales, 92-95. 
complejos, 97-112. 
compuestos, 29. 
construíbles y cuerpos de números, 
138-46. 
definición, 144. 
cuerpos de, 138-46. 
de Fermat, 33, 129. 
naturales, 8, 27. 
negativos, 63. 
pitagóricos, 48-50, 
primos, 28-39. 
racionales, 60-66. 
reales, 66-18. 
sistema de, 60-117. 
trascendentes, 112, 113. 


Ordenes de infinitud, 479-82. 


Pappus, teorema de, 250. 
Paradojas: 

de Zenón, 316, 317. 

del infinito, 96. 
Paralela única, postulado de la, 230. 
Paralelismo e infinito, 192-97, 
Pascal: 

teorema de, 200, 203, 221-24. 

triángulo de, 24. 
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Peaucellier, inversor de, 167-70. 
Películas, experimentos con, 395-407, 
Pendiente, 425, 500. 
Pentágono regular, 
109, 133. 
Perspectivas, figuras, 181. 
Pi, 152, 310-12, 314, 451, 452. 
Pitagóricos, números, 48-50. 
Plano del infinito, 197. 
Plateau, problema de, 396. 


construcción del, 


Poliedros: 
fórmula de Euler para los, 248-53, 
270, 271, 274. 


género de los, 268-70. 
n-dimensiones, 239-46. 
regulares, 248-53. 
simples, 248. 
uniláteros, 271-75. 
Postulados, 226. 
Primitivas, funciones, 448. 
Primos, números, 28-39, 491, 493-96. 
teorema de los, 34-37. 
Probabilidades, teoría de las, 124-26. 
Producto: 
infinito, 311, 491-93. 
lógico, 120. 
Progresiones: 
aritméticas, 19, 20, 33, 34, 497, 498. 
geométricas, 20, 21. 
Proyectiva: 
correspondencia, 190, 216. 
geometría, 177-226. 
transformación, 179-82. 
Pruebas constructiva, indirecta y exis- 
tencial, 95, 96. 
Punto: 
invariante, teorema de, 264-68. 
medio de un segmento, forma de 
hallarlo sólo con compás, 157. 
Puntos: 
colineales, 182. 
del infinito, 192-97. 
series de, 219, 220. 


Racionales, números, 60-66. 
construcción geométrica de, 131-132. 
densidad de los, 66. 
numerabilidad de los, 87-89. 
operaciones con, 61, 62. 

Radiactiva, desintegración, 466, 467. 

Radianes, medida en, 289, 290. 

Raíces de la unidad, 107-10. 

Raíz cuadrada, construcción geomé- 
trica de la, 133. 
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Razón doble, 184-92, 197. 
Reales, números, 66-81. 
continuo de los, 76. 
operaciones con, 78, 79. 
Recta: 
del infinito, 194. 
línea, ecuación de la, 83. 
Rectas: 
concurrentes, 182. 
haz de, 216. 
Red de carreteras, problema de la 
369-71. 
Reflexión: 
circular, 154. 
en los triángulos, 362, 363. 
en un sistema de círculos, 175, 176. 
en una o varias rectas, 340-43, 
problemas extremales de, 363, 364. 
reiterada, 174-76. 
Regulares: 
construcción de polígonos, 129, 133-36, 
505. 
poliedros, 248-53. 
de n dimensiones, 239-46. 
Relativa, notación, 12. 
Relatividad, 239, 242. 
Representación, 153. 
Resolución de problemas, 128. 
Restos cuadráticos, 46, 47. 
Riemann, geometría de, 237-39. 
Rígido, movimiento, 154, 


Schwarz, problema del triángulo órtico, 
357-64, 387. 
Segmento, 65, 82. 
Segunda derivada, 435. 
Sentido de un ángulo, 171. 
Septimal, sistema, 13, 15, 
Serie binómica, 485. 
Series: 
convergencia de, 482, 489, 
infinitas, 482-87. 
Simple, poliedro, 248. 
Simplemente conexo, dominio, 255. 
Sintética, geometría, 177. 
Solución experimental de problemas de 
mínimo, 395-407. 
Steiner: 
construcciones de, 163, 164, 209, 210. 
problema de, 364-71, 387-89, 401. 
Subconjunto, 149. 
propio, 87. 
Subcuerpo, 140. 
Subíndices, 12, 
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Sucesiones, 301-14. 
acotadas, 306. 
convergentes, 

lantes, 305. 
monótonas, 306-08. 
teorema sobre, 326, 327. 

Suma: 
de los n primeros cuadrados, 21. 
de los n primeros cubos, 22, 
lógica, 120. 

Superficies: 
cuádricas, 224-26. 
uniláteras, 271-76. 


divergentes y osci- 


Tangente, 425. 
Taylor, serie de, 486, 487. 
Teorema fundamental: 
de la aritmética, 30, 54, 55. 
del álgebra, 110-12. 
del cálculo, 445-49, 
Teoría de números, 28-59, 491-96. 
Tertio excluso, 95. 
Topología, 247-83. 
y puntos mínimos, 355, 356. 
Topológica: 
clasificación, de superficies, 268-76. 
transformación, 254. 
Toro, 260, 
tridimenstonal, 274-76. 
Trabajo, 475, 476. 
Transformación: 
ecuaciones de, 300. 
geométrica, 153, 177-79. 
proyectiva, 179-82. 
topológica, 253. 
Trascendencia de pi, 113, 152. 
Trascendentes, números, 112-17. 


Triángulos, propiedades extremales de 
los, 341, 343, 344, 357-63, 364-69. 


Trigonométricas, funciones, definición, 
289. 
Trisección del ángulo, 127, 149, 150, 


Unica, descomposición en factores, 
30, 54, 55. 

Unidad: 
circunferencia, 102. 
raíces de la, 107-10. 

Uniláteras, superficies, 271-76. 

Unión de conjuntos, 120, 


Vacío, conjunto, 26. 
Valor absoluto, 65. 
Valores extremos: 
con condiciones de contorno, 386-89. 
en geometría elemental, 341-49. 
principio general, 349-52. 
problemas de, 340-407, 
y desigualdades, 371-76. 
Variable: 
compleja, 488, 489. 
continua, 286. 
dependiente, 287. 
independiente, 287. 
noción de, 285. 
real, 286. 
Variaciónes, cálculo de las, 389-95, 
Vector, 82. 
Velocidad, 432-35. 
Vibraciones amortiguadas, 469. 
Vibratorio, movimiento, 468, 469. 


Wallis, producto de, 493, 520, 
Weierstrass, teorema de, sobre valores 
extremos, 324-27. 


Zenón, paradojas de, 316, 317. 
Zeta, función, 491. 


